スキップしてメイン コンテンツに移動

[C#]Big Size Structが値コピーでつらいならin引数で値コピーしなければいいじゃない!! < それ本当?

C#で高速なプログラムにする際のお供な構造体ですが、構造体を使わないほうがいい場面・条件もあります。
その一つに"サイズが16バイト未満であること"があります。この16バイトという数字の根拠は明確にはわかりませんが、構造体の特性上よく値コピーが発生するのでサイズが大きければ大きいほど値コピーのコストが高まるということからある程度のサイズまでのものがいいというのは想像つくと思います。

そしてこの値コピーが発生する個所としてよくあるのがメソッド呼び出しの引数に構造体を渡したときなのですが、C# 7.2で追加されたin引数/ref readonlyを使うと読み取り専用参照として渡せるので値コピーを抑制することができるようになりました。

そこで「値コピーがつらくてBig Size Structが使えないなら値コピーしなければいいじゃん」(以下in引数戦略)という疑問が生まれます。

実際に測ってみた

値コピーありのメソッド呼び出しとin引数で参照を渡すメソッド呼び出しの相対的な速度比を計測してみることにします。

利用するのはベンチマークのお供なBenchmarkDotNetです。計測実行環境としては.NET Frameworkと最近パフォーマンスが向上した.NET Coreです。(もちろんのことながらホストマシンはWindowsです)

計測対象はこのような感じの構造体です
readonly struct Size16
{
    public readonly int A, B, C, D;
}

readonly struct Size32
{
    public readonly Size16 A, B;
}

readonly struct Size64
{
    public readonly Size32 A, B;
}

Size32からフィールド宣言がめんどくさくて定義済みの構造体を利用していますが、計測したいのはサイズごとの相対比なので問題ないでしょう。

また、計測メソッドは下のような感じです。
[Benchmark]
public int Size32NormalCall()
{
    Size32 v = default;
    return size32(v);
}

[Benchmark]
public int Size32InCall()
{
    Size32 v = default;
    return size32(in v);
}

[MethodImpl(MethodImplOptions.NoInlining)]
private int size32(Size32 size32)
{
    return size32.A.A;
}

[MethodImpl(MethodImplOptions.NoInlining)]
private int size32(in Size32 size32)
{
    return size32.A.A;
}

最適化逃れのためにいろいろ無駄なことをしていたりインライン化抑制の属性を付けていたりします。
これで期待通りに変な最適化さえ起きていなければ、値コピーとin引数の相対的な速度比が求めれるはずです。

これをSize4, 16, 32, 64, 128, 256で実行した結果が下の表になります、また全体のソースコードはgistで公開しています。

BenchmarkDotNet=v0.10.14, OS=Windows 10.0.16299.492 (1709/FallCreatorsUpdate/Redstone3)
Intel Core i7-6700 CPU 3.40GHz (Skylake), 1 CPU, 8 logical and 4 physical cores
Frequency=3328127 Hz, Resolution=300.4693 ns, Timer=TSC
.NET Core SDK=2.1.300
  [Host] : .NET Core 2.1.0 (CoreCLR 4.6.26515.07, CoreFX 4.6.26515.06), 64bit RyuJIT
  Clr    : .NET Framework 4.7.1 (CLR 4.0.30319.42000), 64bit RyuJIT-v4.7.2671.0
  Core   : .NET Core 2.1.0 (CoreCLR 4.6.26515.07, CoreFX 4.6.26515.06), 64bit RyuJIT

また、値コピーを100としたときのin引数との速度差(in引数の速度/値コピーの速度*100で求められるもの)のグラフは次のような感じです。
16byteまではin引数のほうが遅い場面もあり、32byteと64byte付近ではどちらともあまり変わらず、128byteまで行くとin引数のほうが数割早いと読み取れます。

これだけを見るならばBig Size Structはin引数戦略で勝つると思っちゃいますが、これはあくまでメソッド呼び出し時の値コピーを抑制しただけです。

値コピーする場面は他にもある

防衛的コピー

ufcppさんが++C++; // 未確認飛行 C - readonlyの注意点 - readonly struct によるコピー回避で述べられてるように、構造体で定義されているメソッドを呼び出してしまうと防衛的にコピーしてしまうようです。これは同じくC# 7.2で追加されたreadonly structにすることで防げます。

スタックからヒープへのコピー

構造体はローカル変数ではスタックに確保されますが、ローカル変数の場合ではどこに属しているかで確保される場所が変わります。classのインスタンス変数であるとヒープに確保されます。ローカル変数からclassのインスタンス変数に代入すると値コピーが走ってしまいます。
ヒープへのコピーをさせないという制約を持たせるならば、C# 7.2で追加されたref構造体(意味合いとしてはstackonly構造体)にすることで完全にスタック上のみの構造体にすることもできます。ただ、非常に扱いにくくなるので使用するかは考えどころですが。

また、ボックス化するときもヒープへ確保されるので値コピーが発生してしまいます。
構造体をインターフェースの型で確保するなどしてしまうとボックス化してしまうので値コピーが発生してしまいます。
こちらもref構造体で縛ることができます。

代入時のコピー

構造体(値型)の変数を他の変数へ代入してやると値コピーが発生してしまいます。この特性はC#erなら暗黙的に理解できていると思います。

int a = 10;
int b = a;
a = 20;
Console.WriteLine(b);

このようなコードを実行すると10が出力されるのはint b = a;で値コピーが発生しているからです。

これはrefをとってやると値コピーせずに代入できます。
int a = 10;
ref int b = ref a;
a = 20;
Console.WriteLine(b);

こちらのコードを実行すると20が出力されます。

C# 7.3でref再代入ができるようになったので、値コピーを走らせずにローカル変数を使いまわすことはできるようになったのではないかなと思います。

最終的なin引数戦略

  • readonly structを使う
  • in引数ref, out引数を使う
  • ref変数やref再代入で値コピーを減らす
  • なるべくヒープ上に確保しない
    • ref structを使う
    • ヒープに確保される仕様を理解し適切に扱う
以上のような感じでしょうか、もはやポインターを安全にした感じのようなものですね。
(実際に安全に扱えるようにした機構だからしょうがないか………)


Big Size Structのスタック確保とclassでのヒープ確保のベンチマークとか測ってなかったり(おそらくスタックのほうが早いはず)、C#の仕様をまだまだ理解しきれてないアマチュアC#erですが、間違い・考慮漏れなどやマサカリなどあればどしどしコメントに投下してくださいm(__)m
コメントいただいたことないので、はたしてコメント機能が正常に動作してるかわかりませんが、Twitterのほうでも受け付けますのでぜひともお願いしますm(__)m


(in引数戦略と言ったが最終的にはref戦略になってるような気がする)

コメント

このブログの人気の投稿

Stellaris 2.0.1 植民スパムプレイ

さっそくですが、友達との3日がかりのマルチプレイ終わりました。

銀河設定は中サイズ(600)、リング2、中盤の危機75年早く、終盤の危機100年早く、技術・伝統コスト0.5倍、難易度普通って感じでした。

そして、自分のプレイングは機械帝国植民スパム、友達は内向き牧歌でした。
最終的な国力としては機械帝国植民スパムのほうが強く、序盤から中盤は内向き牧歌のほうが強かったです。

機械帝国植民スパム はい、前回も言いましたが2.0から植民スパムゲーです。2.0.2からは前哨地維持費がかかるようになり更なる植民スパムゲーにもなりそうです。
植民スパムするからには、まぁロボットか機械帝国って感じなんですが、今回はゲーム進行が速い設定なので機械製造速度アップにガン振り帝国にしました。生産はエネルギー重視で、直轄地に鉱物惑星・研究惑星があるような感じにしました。
それでも、機械帝国は序盤の成長が遅く、鉱物を大量に消費するので、周りの帝国との不可侵条約はかかせません。直轄地6惑星(母星・エネルギー、エネルギー、研究*3、鉱物)の発展が終われば、今度はセクターの開発です。 まぁ、セクターの開発なんか物資さえ送り込めば勝手にやってくれるのでいいですが、エネルギー重視の生産なので鉱物の面倒は見てやらないとダメです。
帝国所有惑星が20ぐらいになれば、まぁ中銀河(サイズ600)なら敵なしですかね。あとは軍拡するだけです。
中盤の危機と終盤の危機 前述の通り危機はかなり早く発生するようにしたのですが、なんと中盤の危機がいっこうに発生しませんでした。発生したのは終盤の危機に立ち向かってるとき…おい()
終盤の危機は機械帝国プレイだったのでもちろんのようにコンティンジェンシー、中盤の危機は機械の反乱でした。
中盤の危機に関しては機械帝国プレイなので自分はどうでもよかったのですが、終盤の危機はがんばらないとまずかったです。コンティンジェンシーなので機械の生産-40%補正がつくので、スペシャルプロジェクトで解除(自分の研究力500ぐらいでは50か月ぐらいでした)しない限り国力が持ちません。
コンティンジェンシーは艦隊戦力が300k+100k*2の集団が4つほど湧いて100k艦隊は時間とともに増え続けるので急がないといけませんが、解除さえすればあまり余る国力で殴り続けるだけでしたね。終盤の危機の間に…

Stellaris ver2.0 Apocalypse プレイ感想

タイトルの通り大型アプデ後での友人とのマルチプレイでのプレイ感想です。

変更内容に関してはこちらのサイトで日本語訳された内容が公開されています(本当に助かりました)
Simulationian.com - 「Stellaris」開発日記#105――2.0「チェリイ」パッチノート

使用した帝国について 細かい設定は覚えていませんが(確認するのもめんどくさい)、有機生命体で狂信権威・平和主義で国是にアップデート内容の生まれた生命(Life-Seeded)を選択しています。 狂信権威について アップデートにより帝国の領域を増やすには星系ごとに影響力(1回限りに支払い)を使い前哨地を建てていく必要がありました。そこで狂信権威を選択したのですが、プレイスタイルが悪いのか、よく奴隷が不満を抱えストライキ?を起こしてしまいました。これに関しては防衛設備を地上に建て防衛軍を増やすことで対処できますが、タイルを無駄に消費している感じがすごいあります。 影響力が毎月4増えるのは領域を増やすのに好都合でしたが、Life-Seededとの相性が微妙でした(後述)。 Life-Seededについて 自分の種族がガイア型惑星にしか住めなくなるが、母星がガイア型25でスタートします。使用感想としては初期ブーストはいいかな?って感じです。ただ、アップデート後の環境ではプレイスタイルを頑張らなければ弱いかなと。その理由としては、まずアップデート後は研究コスト補正にPOP数が関係なくなり領域星系数が関係あるようになりました。つまり領域が大きければ大きいほどコストが高くなるということ。星系の資源はプレイヤーではどうしようもならない固定資源のようなものですから、それに頼って領域を大きくし過ぎると研究コストがすごいことになってしまいます。植民地を確保して賄おうにもガイア型にしか住めないのでかなり増やしにくいです。 ガイア型にしか住めないというのは、有機生命体であってロボットなら他のタイプの惑星に植民できるというのであれば、Life-Seededはロボットプレイをするしかないのかもしれないですが、これに関しては未検証です。
プレイスタイルについて 今回自分がとったプレイスタイルは要塞でガン守りキメるガチ芋戦略です。アップデートで要塞関連が変わり結構使えるものになったらしいので。 防衛プラットフォームを上限まで…

if(flag == true)はありなのか?なしなのか?

最近バズってるようなので便乗
ちなみに元ネタはこちらだとおもいます→qiita - Javaではif (flag == true)というコードを書いてはいけない

※真偽値としてのネーミングとしてflagはナシだろ~~wという話はナシでお願いします
※以下flag変数は真偽値とします

結論から言うと純粋な真偽値の場合はif(flag == true)、if(flag == false)はナシです

まず、最初に前提を整理します
if文は真偽値(true or false)で判定しなければならないJavaではbooleanKotlinではBooleanC#ではbool 話の簡素化のために整えておかないといけないこともあります JavaではBooleanのことは考えない(理由は省略)(ボクシング次第では考えていいかも)KotlinではBoolean?のことは考えないnullableな場合はtrue or false or nullなのでC#ではbool?のことは考えないnullableな場合はtrue or false or nullなので
前提を整理し終わったので、if(flag == true)はアリなのかナシなのか考えていきましょう。 おそらくif(flag == true)論争では2つのパターン(==演算子で比較するかどうか)に派閥分けされていますが、ここでは3つのパターンに分けます
1つ目のパターン:==演算子で比較する// true比較の場合 if(flag == true) // false比較の場合 if(flag == false) はい、もっともナシなパターンです(理由は後述)。

ナシと言われる理由は前提を振り返ればわかりますがif文の中では最終的に真偽値であればよいのですがflagはそもそも真偽値です。わざわざtrueと==比較して真偽値にする必要はありません。わざわざ==比較することは理論上はパフォーマンスが落ちます。

このパターンがなくならない理由は可読性がまぁまぁいいことです。
冗長であろうがパフォーマンスが理論上悪かろうが可読性があれば正義です(そういう考えもできる)。

自分も昔はこのパターンな書き方を多用していましたが後述の理由によって今はしません(少なくとも意識してはしてないはず)。

2つ目のパターン:否定演算子!を使う// true比較の…