大坂なおみ発言誤訳の理由②英単語は複数の品詞を兼ねる事になれていない2019年02月01日 21:17

 前回、前々回に続いて、歌詞の誤訳の話。
 ネット上にあふれる誤訳を見ていて思うのは、英単語は動詞と形容詞などを一つで兼ねる事や複数の意味があることがわかっていない事。そして、それを見分けるために必要な文法がわかっていない事だ。
 これは、日本の英語教育における文法を無視した単語の意味の丸暗記と、歌詞などを流れでなんとなく理解しようとする事が原因かと思う。

 マドンナのヒット曲like a virginのlikeを好きという意味だと思っている大人が多い事に驚愕した事がある。これなんかもlikeが前置詞にも使われる事を知らないためだ。
 また、昔あるライターがTears For FearsのEverybody Wants to Rule the Worldという歌詞(タイトル)を引用して、「すべての人が世界のルールを欲している」と書いてきたので、いや、違う、と。もし、その意味ならEverybody Wants the Rule of the Worldとなるはず。「すべての人が世界を支配したがっている」が正しい。これなんかも、ruleに名詞(規則、統治)と動詞(支配する)の2つの品詞を兼ねている事を知らないから、toの後に来るのは動詞でなければならない事に気づかないのだ。日本語では、「動き」と「動く」、「楽しい」と「楽しみ」など名詞、動詞、形容詞が完全に同形という事はまずないから混同する事はない。英語は単語単体では区別が付かないのでtoやofなどの前置詞や、文のどこにあるかなどで識別しなければならない。

 ところで、大坂なおみインタビューの「なぜ多くの人が騒いでいるのか分からない」というあり得ない誤訳の理由。動画を聞き直して分かった。
全豪オープンの公式サイトでは省略されているが、本人がちょっと言いよどんで、I don't, like, I getと続けている。
そのため、I don't get why people would be upset about it.と言ったように聞こえたのだろう。
これはその場ではしょうがない聞き間違いだろう。
やはりこういう場合は慎重に録音を聞き直す、公式サイトで確かめる、といった作業が必須だ。

大論説委員も統計のウソの意味が分かってない2019年02月06日 11:48

 先週、毎日新聞の論説委員がマーク・トウェインの統計とウソに関する格言を引き合いに出し、今週は、朝日新聞の編集委員が「統計でウソをつく法」を引用していた。国会でも連日話題の厚労省不正統計になぞらえての話だが、どうもこの2人には科学する心がないらしい。
 今回の統計不正と、「統計でウソをつく法」は意味が違うのだ。
「多くの統計は、額面通り受け取るとウソばかりである。統計は、数字という魔術によって、人々の常識を麻痺させる」という「ウソをつく法」の一説が出ていた。
 「統計でウソをつく法」とは「正しい統計で、間違ったことを事実と思わせるだましのテクニック」という意味だ。サンプリングなどを数学的に正しいやり方でやったまともな統計データであっても活用の仕方で人々をだませる悪用法を指す。厚労省のようにデータ自体に不正な操作を加えたり、間違った方法で統計を取ることは統計でウソをつく事にならない。それはただの間違った統計だ。データ自体をねじまげていいなら、わざわざ統計のトリックを使わなくても、何に関してだって、ウソをついてだますことができる。

 統計でウソをつくというのは例えばこんな方法だ。

 毎日コーヒーを飲む人と、まったく飲まない人を10年間追跡調査したら、飲む人の方が3倍も多く肺がんになった。だから、コーヒーには発がん性がある。
 これが間違いである理由はサンプリングや検定の方法が数学的に厳密であるかどうかと関係ない。コーヒーを飲む人は飲まない人に比べて、喫煙者が多く、飲まない人には非喫煙者が多い。肺がんが多い原因はコーヒーではなく、喫煙にある。非喫煙者だけでコーヒーを飲む人と飲まない人を比べたらほとんど差は出ないだろう。これはよくある相関関係を因果関係にすり替える方法。だましの基本テクニックだ。

 厚労省の統計不正は、統計を悪用したウソではない。そもそも統計の取り方自体が数学的に間違っているので、文書やデータの捏造にあたる。事例としては高血圧薬ディオバンの論文不正に近い。製薬企業の社員がディオバンの試験をしている医療現場から集めた生データに対し、狭心症や心不全を防ぐ効果が高くなるよう改ざんを加えて、論文を書かせたという事件だ。

 繰り返す。統計のルールに従わずに恣意的にデータを集めたり、データを後になってから都合良くねじ曲げていいなら、どんなウソでも可能であり、それは「統計を悪用したウソ」とは意味が違う。

「病名・白血病」は「好きな食べ物・麺類」と答えるような物2019年02月16日 17:33

 「池江璃花子選手が白血病と診断されたことを公表」のニュースに、白血病にちょっと詳しい人は違和感というか、多少戸惑ったのではないかと。
 おそらく、これからも詳しい診断名はあえて出さない方針なのではないか。本人が進んで公表しない限り、SNSや雑誌などでの詮索は止めてあげて欲しいというのが個人的感想だ。

 お笑いコンビ・ピスタチオのネタに
「好きな食べ物は?」
「まかないです」
「なんの!?」
というのがある。

「病名は白血病」というのも「好物は何?」と聞いたら「丼物です」と返ってきたようなもの。
いやいや、それって、牛丼なの、カツ丼なの、親子丼なの、天丼なの、もしかして、海鮮丼?
 ちょっと頑張ってローストビーフ丼ご馳走してあげたら、「ぼく、牛だけは食べられないんで」とか言われたりして。

 たった1個の白血球の遺伝子に狂いが生じ、がん細胞化、無限に増殖し、ほかの血液成分が作れなくなり、貧血など重い症状が出る。というのが白血病。でも、一口に麺といっても、うどんもあれば、ラーメンもあり、きしめんもあり、パスタの中にはさらに細かくフジローニもあれば、リングィーネもあれば、タレッティもある。
 それと同じで、白血球にもいろいろ種類があり、それがどの遺伝子の変異でがん化するかによっても細かく分かれる。細かい種類によって病状や治療法が違う。
 例えば、格闘家アンディ・フグの急性前骨髄球性白血病は、急激に症状が出るが、ビタミンAの仲間レチノイン酸が劇的に効き、白血病細胞は死滅する。ほぼ完治に近い。昔、急性前骨髄球性白血病は8割以上が治るとされると書いたら、他の種類の白血病患者の家族からどうしたら治るのかと相談のお便りが来て、困った。
 また、慢性骨髄性白血病(CML)は原因遺伝子が1個だけで、そこを標的としたグリベックなどの薬で抑えることができるが、体がだるくなるなど副作用があり、現時点では一生薬を続けることになる。
 このように詳しい分類名が分かると、標準治療でどのような処置を受け、どういう経過をたどるか大体予測できてしまう。しかし、そんなことが分かったからといって誰が喜ぶのか。テレビのワイドショーなどで医療コメンテーターがしたり顔で「この病気はですね、」と説明するのを見せられても不愉快なだけだ。
 とにかく、SNSも雑誌もワイドショーも病名や進行状態をこれ以上追求せず、そっとしておいてあげればいいのに。と、思うが、無理なんでしょうね。

美しくない日本語は見たくない2019年02月18日 17:39

同級生から山中さんに関する質問メールが来た。
返事する気になれなかったので、無視した。
その後も、他の質問に加えて、同じ質問が3、4回来たが、他の質問には答えても無視した。
さらにしつこく聞いてきたので「空気読め」と返した。

 なぜ、返事する気になれないのか。理由は、その文面にある。

質問メールの中に、狂うに大きいと書いて「キョウダイ」。
あるいは「脳減ル賞受賞者」などと書かれている。

 一般社会では固有名詞の誤字は極めて非礼な行為だが、マナーが悪かろうが無礼だろうが面白ければ私は許す。だが、笑いのセンスが欠片もない。

 こんなのは鼻水垂らしている中高生が面白がるような事。今時、発展途上地域のヤンキーでもやらない。
もしも、面白いと思ってやっているなら、六本木や表参道を界隈とし、周囲はJGや館に囲まれている町で育った人間の感性としてダサすぎる。
 それを指摘する事さえセンスを疑うので、華麗に無視していたのだが。

 かてて加えて、私の職業は毎日、日本語と向き合う仕事だ。
私は日本語やフランス語を世界的にも極めて美しい言語だと思っている。職業柄、その美しき言語を汚すような美しくない文字を書いたり、口にすることもしないよう心がけている。社内メールで厳しく他人を非難するようなことを書いたり、口頭で大げんかすることはよくあるが、そのような際にも、相手がどのように口汚く罵ろうと、自分は汚ない言葉を絶対使わないようにしている(関西弁で言えば、ボ○、カ○の類いの罵倒語など。ヤンキーやイナカなどもあまり美しくはないかもしれないが、日本語を汚すほどではない)。
 実際、BBSなどで、匿名とは言え、他人をハ××、テ×××、キ×××などと罵っているのを見ると、この人は本当に、日本語を、日本の伝統文化を、愛しているのだろうか、と信じられない思いになる。
 私だったら同じ事を表現するにしても、「先ほどからあなたの言っている事はとても正気の沙汰とは思えませんが」とか「頭の中の重要な神経が何本か断線してませんか」と正しい日本語で返す。
 従って、そのような文字列に対して、まじめに相手をする気はない。面白ければ別だが。

本当ですか、青野由利さん?2019年02月21日 19:32

 以前に書いた「統計でウソをつく法」の話。理系の知人から「自分も同じ感想だった」と言われた。やはりか。あれはブルーバックスの超有名本。どうも論説委員たちはあれを読んでないんじゃないか、という気がする。
 さて、科学ジャーナリストの青野由利さんが4週間ほど前に「勤労統計ミステリー」という記事を書いている。<すっきりしないのは「行政手続きのルール違反」と「統計学のルール違反」が混在しているため>というのは全くその通りなのだが。
 気になったのは、「統計学の観点から」厚労省のミス(もしくはウソ)を論じる件(くだり)で、<それ以上に驚くのは抽出データから全体を知るのに不可欠な母集団への「復元」処理を、厚労省が怠っていたことだ>と書いていること。都だけ3分の1を抽出したのに、他道府県の全数調査と足す時に3倍しなかったことを指しているのだが。
 この記事だと、3分の1に3をかけるこの操作が統計学の観点から正しいと読めるが、少なくとも私が今まで教わってきた常識ではこんな事は統計学で認められていない。こんな事というのは、抽出調査のデータを抽出率で割って元の倍率に戻せば、全数調査と抽出調査を足し合わせてもいいという事だ。
 1+1は2、1+1/3×3も2。確かに小学校の算数ではそうなるが。それをそのまま統計に当てはめてOK?

 例えば、都道府県全部を3分の1の抽出調査にしていた場合。東京以外の道府県はすべて99%以上の回収率なのに、東京だけ80%しか回収できなかったとする。そのまま足すと偏ってしまうので、80%しか回収できなかった東京の分をほかの99%に近づけるために1.24倍してから足す。と、いうのならわかる。
 この場合、同じ調査法、同じ抽出法で、回収率に大きな差が出たための調整だ。それでも、あまりに差が大きいと調査の精度がひどく悪くなるので、できる限り回収率を上げる努力をしなければならない。
 しかし、厚労省は全数調査と抽出調査という違うやり方を足してしまっている。しかも、3倍というのは差が大き過ぎる。
 40年近くにわたって科学報道一筋の青野さんが書く事だから、まあ、信じたい所ではあるのだが。


 今は、法律で決めた事を守らない規則違反が責められている。そりゃあ、不正は不正だが、科学する心からすれば、規則遵守以前に中央官庁の役人たるものが、これほど統計の常識がない事の方が恐ろしい。

 正確で価値のある統計データを取るには数学的、科学的に守らなければならないルールがある。

例えば、

(1)全体からサンプルを取る抽出は無作為に。変な偏りが入らないよう注意する。
(2)抽出法など調査の仕方を調査の途中で後から変えてはいけない。
(3)異なる調査で集められたデータを混ぜる時はデータの条件をそろえなければならない。

どれ1つまともにやってない。この無知さが怖い。