Intel Architecture プログラミング 新しいページはコチラ

提供: yonewiki
移動: 案内, 検索
(プログラムの例)
 
1行: 1行:
 +
[[メインページ#言語と開発環境|言語と開発環境]]へ戻る。
 +
 +
 
 
== '''概要''' ==
 
== '''概要''' ==
 インテルアーキテクチャーはWindows OSの命令を処理するCPU インテルプロッセッサの技術で、Visual C++コンパイラやGCCコンパイラでこのアーキテクチャーを使うことができるようになっています。この命令セットはいわば、最先端アセンブラ言語と言える高度なアセンブラの命令を理解することにもつながります。プロセッサあるところにアセンブラあり、IntelのCPUにもアセンブラがある。SIMDと呼ばれるSingle Instructure Multiple Dataという方式のCPU処理方式で、一つの命令で複数のエータを処理できるという方式です。
+
 インテルアーキテクチャーはWindows OSの命令を処理するCPU インテルプロッセッサの技術で、Visual C++コンパイラやGCCコンパイラでこのアーキテクチャーを使うことができるようになっています。この命令セットはいわば、最先端アセンブラ言語と言える高度なアセンブラの命令を理解することにもつながります。プロセッサあるところにアセンブラあり、IntelのCPUにもアセンブラがある。SIMDと呼ばれるSingle Instructure Multiple Dataという方式のCPU処理方式で、一つの命令で複数のデータを処理できるという方式です。
  
  
 え?そんな低レベルのプログラミングって今どき必要なの?ってあると思いますが、無駄がなく、高速に計算をするときは、このレベルにまで落とし込んだプログラミングにすることは、よくありって、画像処理や動画処理の根幹をなしています。こんな難しい技術を覚えても、さほど役に立たないかもしれません。Intelの英語WebSiteとかにいくと命令セットの仕様が公開されています。最近はVisual C++でちょちょいっとやるだけで使えるようになっているので、知っててもいいんじゃない?という基本的なアセンブラ処理もあるので、面白半分で使ってみるのもいいかもしれません。いつか役に立つときはあると思う。
+
 え?そんな低レベルのプログラミングって今どき必要なの?ってあると思いますが、無駄がなく、高速に計算をするときは、このレベルにまで落とし込んだプログラミングにすることは、よくあって、画像処理や動画処理の根幹をなしています。こんな難しい技術を覚えても、さほど役に立たないかもしれません。Intelの英語WebSiteとかにいくと命令セットの仕様が公開されています。最近はVisual C++でちょちょいっとやるだけで使えるようになっているので、知っててもいいんじゃない?という基本的なアセンブラ処理もあるので、面白半分で使ってみるのもいいかもしれません。いつか役に立つときはあると思う。
  
  
35行: 38行:
  
  
 
+
■実行結果
  
<syntaxhighlight>
+
<syntaxhighlight lang="text">
 
  source:      1,    256,  1024,  65536
 
  source:      1,    256,  1024,  65536
 
  result:      1,    256,  1024,  65536
 
  result:      1,    256,  1024,  65536
 
</syntaxhighlight>
 
</syntaxhighlight>
 +
 +
 11行目からmovdqaが使われています。第一オペランドのxmm0レジスタに第二オペランドのint配列srcからまとめて格納転送されます。後ろのオペランドから、前のオペランドにデータが転送されている感じです。C++言語側で確保した配列との連携をする場合この操作で、間違いが起こらないようにするには配列が連続していることが重要になりますので、__declspec(align(16))という宣言をしました。16としたところには2の階乗になっていれば、その分だけ連続して配置するように働きます。アライメントといいます。タイヤのアライメントしか知らない人や半導体プロセスのLithography工程や重ね合わせ検査工程やその他、特定位置を検査する装置で必要な画像認識処理のアライメントとかしか知らない人もいるかもしれませんが、位置出しという日本語がちょうどいい感じのニュアンスに変換できると思います。
 +
 +
 +
 12行目ではxmm0レジスタから配列へデータが転送されて、srcの内容がdstにコピーされるという動きになっています。
 +
 +
 +
 このように、C++言語での操作の中に制限付きの配列変数を使ったり、Intel Architectureの低レベル命令を駆使することで、ものすごく特殊なデータの転送処理が一括で処理することができます。通常のプログラミングだけではなし得ない、高速な手法です。
 +
 +
 +
 ちなみにmovdqdという命令を使うにはIntel Pentium4プロセッサから導入されたIntel SSE2テクノロジという命令セットがCPUに搭載されていなければ、このプログラムをコンパイルすることも、実行することもできません。ほとんどの後継のプロッセッサにはこれらの各種テクノロジは互換性をもって搭載されていますので、それらのプロセッサでも動作します。管理人のCore i7 第3世代やAtom x5 Z-8300プロセッサでも動作しました。Core i7は2012年のモデルのPCです。2018年は第9世代を迎えようとしています。進化が凄い。今でも十分速い動作してますので、買い替えたいとは思わないです。おどろくほど、快適なんでしょうけど。3Dのレンダリングとか動画の変換とか、そういう作業をあんまりしないので、恩恵はあまりないですね。それよか人間が動く方が遅くて、入力待ちの方が多いっす。生活の全てを自動化したいっす。お金持ちの人は、バシバシとPCを新調していただいて、無駄に速いPCを使って頂ければと思います。妬み。どうせ使いこなせてない人がほとんどなんでしょう。妬み。嫉み。(ねたみ。そねみ。)話が脱線しました。
 +
 +
 +
 こういった命令セットを説明していくと広辞苑くらいの情報量が必要になってきます。現にIntelのアーキテクチャー説明資料もPDFで何千ページというボリュームになっています。よく使いそうなものを、ここでは紹介していくかもしれません。それでも、きっと書き終わったころには定年を向かていることでしょう。
 +
 +
 
 +
[[メインページ#言語と開発環境|言語と開発環境]]へ戻る。

2020年9月28日 (月) 00:00時点における最新版



個人用ツール
名前空間

変種
操作
案内
ツールボックス