超時空超巨大小学6年生

ときどき何か書きます。そんなに面白いことのってないよ

ネットで見た話〜増田を読んで増田とブコメが気になった

増田読んでブコメ読んで、いろんなことが気になったのでまとめておく。あんまりしゃちほこばっていちいちブログに書く内容でもないのだけど、自分の言葉で説明しておく訓練の一環としてこうやって書いた。

あいも変わらず日々増田を読んでるんですけどね、今週ちょっと内容的に気になるものがあったのでその話をば。ブクマページのコメントも含めていろいろと気になりすぎたのでここで少し確認の意味をこめて書いておく。

anond.hatelabo.jp

増田は国立社会保障・人口問題研究所というところが公開している「出生動向基本調査」というもののデータを引いて表題の主張をしているのだが、その主張の裏付けのために実に不思議な計算をやっているのが気になった、という話です。

www.ipss.go.jp

増田が「出生動向基本調査」からもってきている数字は「調査別にみた、結婚相手の条件として重視・考慮する割合」(リンク先はCSV)に載っており、これが何の結果なのか、どんなことをどのように調べた結果なのかは 『第16回出生動向基本調査 結果の概要』というPDFが別に公開されていてそれを読めばわかるかたちになっている。もっとも、増田本文を読めばそれとなく予想はつくのだが。何か———おそらく結婚について何らかのアンケート調査を、人数ははっきり増田は書いてないが、男女それぞれが異性に求める何かに対する条件を調べた、ということはわかる。ってあんまりはっきりしないな。せめて「結婚相手の条件」として“男は容姿と人柄しか気にしてない”ということくらいは限定して書いてくれないと意味ないんじゃないかこれ。結論に「結婚相手の条件として」なんて書いておくとかさ。

結論
先に結論だけ書くが、男は容姿と人柄しか気にしてない

気にしてないって何について? ことほど左様に増田はこれが「異性に求める結婚相手としての条件」ということをはっきり書かないままふわっと書きつらねているのである。最後まで。

「結果の概要」とやらを見てみよう。増田の抜き出してきたデータ(と増田が抜き出してこなかったデータ)がグラフになっているのはp.33にある図表 3-2だ。ここに引用しておく。

国立社会保障・人口問題研究所『第16回出生動向基本調査 結果の概要』よりp.33 図表 3-2

さらにこの図のキャプションには以下のようにある。これで増田がもってきたデータがどのように調査されたのか最低限のことがわかる。(読みやすさのために適当に改行とボールドを入れた)。

対象は「いずれ結婚するつもり」と回答した18~34歳の未婚者。
設問「あなたは結婚相手を決めるとき、次の①~⑧の項目について、どの程度重視しますか。

①相手の学歴(学歴)、
②相手の職業(職業)、
③相手の収入などの経済力 (経済力)、
④相手の人がら(人柄)、
⑤相手の容姿(容姿)、
⑥共通の趣味の有無(共通の趣味)、
⑦自分の仕事に対する理解と協力(仕事への理解と協力)、
⑧家事・育児に対する能力や姿勢(家事・育児の能力や姿勢)

(1. 重視する、2.考慮する、3. あまり関係ない)。

増田が本文中に書いているパーセンテージの数字は、この各項目について「1.重視する」と答えた割合とわかる。割合しか書いてなくて男女それぞれ何人でやった調査なのか気持ち悪いが、これは前述のローデータCSVを見るとちゃんと書いてある(男性回答者が1654名、女性回答者が1731名)。

まず増田の主張(男は容姿と人柄しか気にしてない)がこのデータと照らし合わせて妥当なのかは甚だ疑問だ。言いかえると、増田はこのデータ(あるいはグラフ)を正しく解釈できていないということになるのだが…。

グラフを見てみよう。

人柄:男性が女性に求める条件(図上段)の灰色のバー(重視すると答えた割合)は、「人柄」において他の項目よりも目立って高くなっている。一方、女性が男性に求める条件(図下段)についても男性から女性に求める条件と同様の傾向であるが、その割合は第16回調査(2021年)だけを見てもむしろこちらの方が高い。

容姿:男女ともに異性に求める条件として、「容姿」は他の項目とくらべて(少なくとも「重視する」と回答した割合 i.e. 灰色のバー)高いとは言えない。「重視する」と回答した割合だけなら、「仕事への理解と協力」「家事・育児の能力や姿勢」のほうが「容姿」と比較して高いと言える。

はやい話が“男は容姿と人柄しか気にしてない”かどうかは、それが少なくとも「結婚相手の条件」に関しては違うと言えるのである*1

このあたりの、単純に増田が出してきた数字だけを見比べただけでも増田の主張がおかしいことはブコメでも何人かが同じようなことを指摘している。たとえばこれとかね。

男の方が見た目重視なのはデータで出てる

「男は容姿と人柄しか気にしてない」男も仕事と家事の方が気になってますやん。そこ無視したら女は経済力と人柄しか気にしてないってことになるぞ…

2023/01/26 14:42
b.hatena.ne.jp

しかし俺が気になったのはもっと別のところで、それは次のようなことだ。

男女の比較
まずはばらつきを数値化するために標準偏差を求めよう

男性:391

女性:450

つまり女性の方が満遍なくいろんなことを気にしていることになる

??????????

言うまでもないことだが標準偏差(Standard Deviation)はいうなればデータのばらつきを表す指標だ。ばらつきとは、平均値から個々のデータどれだけ離れているかその平均だ。だから、標準偏差を出すには個々のデータの、平均値との差の平方をすべて足し合わせ(平方和)、それをデータの数で割ったものの平方根を計算する。平方和をデータ数で割っただけのものは分散(Variance)と呼ばれる。平方根をとるのはもとのデータと次元を合わせるためだ。分散のままでは単位的に2乗されたままになってしまう。

そしてこれも言うまでもないことだが、平均を出すからには(そして標準偏差を出すからには)、データはすべて同じ数直線上の上に乗らなければならない。

100人いるグループの身長は100人違います。100人の身長は同じ「身長」という軸の上にプロットできます。じゃあ大掴みにその100人のグループの身長分布の特徴を言い表してください。平均値とばらつき(標準偏差)という2つの数値を使うのが都合がよいでしょう。なぜなら、身長データなんてものはヒストグラムを描けばだいたい正規分布状(平均値付近が一番人数多く、左右対称)になるからです。

増田の乗せてる数値でそのように使えるものってないわけなんです。「異性に結婚相手として求める条件」のそれぞれに対して「重視する」と答えた割合を平均しても意味はありません。学歴を重視すると答えた割合と職業を重視すると答えた割合を平均してもだから何? という話です。数値に対して出てる「標準偏差」も大きすぎるし(平均との差の平均だから元のデータよりそんなに大きくなることはない)。

最初は増田は単に乗せてる数値を使って計算したのではないのではないか? と思いました。まさか、そんな。 それで、なんとか元のCSVにある数字を使って、とりあえず数学的に正しいかは別にして、増田の出した「標準偏差」が計算できるかちゃんと確認しました。

うん。どうやら各条件の「重視する」と答えた度数の「標準偏差」を計算したみたいです。男性が≈391、女性が≈450と「標準偏差」を計算したら出てきたよ。度数に並んでる数字をエクセルの標準偏差関数であるstdev.p*2に入力したら出てきました。

意味ねーから! その計算!!!

ブコメでもたとえば以下のように同じことを書いてる人はいる。

男の方が見た目重視なのはデータで出てる

「まずはばらつきを数値化するために標準偏差を求めよう 男性:391 女性:450 つまり女性の方が満遍なくいろんなことを気にしていることになる」 出たー。意味不明な計算をする奴wwwww

2023/01/26 21:55
b.hatena.ne.jp ↑まあちょっと煽りすぎだと思うけど、言ってること自体は正しい。

男の方が見た目重視なのはデータで出てる

各回答項目のばらつきから標準偏差求めて、そこから個別回答の偏差値出すの?めちゃくちゃじゃね?男性が女性より容姿重視なんて素直に24.6%18.8%でわかるじゃん。何がしたいの?

2023/01/26 20:31
b.hatena.ne.jp

ただ、増田の“女性の方が満遍なくいろんなことを気にしていることになる”というのは少しだけ合ってる部分もあって、女性の方は学歴・職業・経済力を「あまり関係ない」と回答しなかった割合が男性より高いのだよね。他の項目は男性と同程度だけど。ここから女性の方が男性よりも、異性に結婚相手として求める条件は多様であると言うことはできなくもない。かもしれない。

あと、ブコメで一番気になったのはこのブコメかな。一番最初にブクマしてコメントしてるわけだし。

男の方が見た目重視なのはデータで出てる

間違い。女性の方が回答総数が多いので標準偏差で比べてもあまり意味はない。少なくとも「満遍なくいろんなことを気にしている」は違う。/ 『ちなみに…』は、「仕事への理解」の偏差値だと女性55.8・男性55.9。

2023/01/26 11:03
b.hatena.ne.jp

これにメタブでこうコメントしたのです。

『男の方が見た目重視なのはデータで出てる』へのコメント

男女間での回答総数が違うことがこの増田の標準偏差の使い方のおかしい点のクリティカルな点ではないと思う…(強いて言うなら標準偏差を計算していること自体がおかしい)

2023/01/26 23:27
b.hatena.ne.jp

なんで回答総数が違うと標準偏差を比べる意味がないのかよくわからないんですけど……平均的にデータが平均値からどれだけ離れているかというのが標準偏差なんだからデータ数が2群で違っていてもいいと思うけどな。まあ、それより標準偏差を計算してること自体が先に説明したように、おかしい。

それからこのブコメ。結構な数のスターを集めていて人気なんだけど、リンク先(PDF)を読んでみたらあらまあそのコメントはちがくない? というものだったんですわ。

男の方が見た目重視なのはデータで出てる

データで言うと「男も女も、女に対するときだけ容姿が評価基準になる(男の容姿はどちらも大して重視しない)」かと。ソース: <a href="https://www.niigata-u.ac.jp/wp-content/uploads/2020/05/200522rs.pdf" target="_blank" rel="noopener nofollow">https://www.niigata-u.ac.jp/wp-content/uploads/2020/05/200522rs.pdf</a>

2023/01/26 13:07
b.hatena.ne.jp

PDFは新潟大のプレスリリースで研究成果として公開されているもの。 www.niigata-u.ac.jp (いま気づいたのだけど、なかなかブクマも集めてますな)

どんな研究かというと、Tシャツの魅力評価が、それを着ている人の容姿に影響を受けるかを調べたもの。実験の結果としては、着用者の容姿は影響するが、着用者が男性のときに比べて女性のときその影響は大きいことがわかった、というものです。

ブコメのまとめかたはちょっとちがうよね?

まるで容姿そのものに対する評価のような書き方をしているし、実験では以下に引用するよう、小さいといえど男性が着用者のときも容姿の影響はちゃんと出てる(ボールドは自分が強調のために与えた)。

高魅力顔と低魅力顔の差は,顔が男性のときには(統計的にはゼロではないと言えるものの)とても小さな差でした。これに比べて,顔が女性のときには大きな差がありました。この結果は,評価する人が男性でも女性でも同じでした。

統計的にゼロでないと言えるということは、着用者が男性のときも魅力が低い顔と高い顔でTシャツの魅力評価には統計的に有意な差があったということです。統計的に有意な差があるということは、Tシャツに対する魅力評価に高魅力顔条件と低魅力顔条件で本質的な差は無いと仮定した場合に、実験データから計算できる統計値が得られる確率がある一定の水準(5 %あるは1 %)以下になることを意味する。つまり、最初においた仮定が間違っていたと判断できるため、2つの条件に本質的な違いがあると考えることができる。

もし仮に「女に対するときだけ容姿が(Tシャツ魅力の)評価基準になる」のなら、こんな有意な差は男性着用者条件のときに見られないはずである。「女に対する〜」は逆に言うと、男性がTシャツ着用者であるとき着ているTシャツの魅力評価にその男性の容姿は基準として用いられない。男性の容姿は評価に影響しないということになる。それでは顔魅力の高低で有意な差は生まれないはずだから。

もっとも、「男の容姿はどちらも大して重視しない」は結果の解釈として合ってはいるのだけれど。Tシャツの魅力評価において———というただし書きはつくけれど。

だいたい書きたかったことはこんなもん。以上。

*1:これは「重視する」に加えて「考慮する」と答えた回答者まで含めて考えても同じだろう。「〜しか気にしない」のなら、バーの高さは白い部分まで含めて「人柄」と「容姿」のみ高く、他が低くなるはずである。

*2:ちなみにstdev.sだとデータ数から1引いた数で平方和を割ってでてくる不偏標準偏差というものが出てきて、これを母数(母集団の統計値)の推定値として使うことがある。pはpopulationのpで、sはsampleのs?