kyoneco’s blog

教育、数学、統計といったテーマについて考えていきます

夏に多くの人が勉強にむかう理由

 この数年、夏になると受験数学や勉強法について興味がわいて、Youtubeなどで調べるということをなんだかしています。この周期的な受験への興味が湧く現象について考えてみたいと思います。
 まず時期なのですが、夏、特に盛夏である7月下旬から8月上旬です。お盆前の日差しの厳しい暑い夏です。家族の帰省といったイベントに当たりやすい時期でしょうか。自分は仕事の関係でお盆に帰っていませんが。この時期は一人になる時間が増える時期です。一方、数学や勉強法などはいつでも動画などで調べられることなのです。では、なぜこの時期にそういったことがらへの興味がわいてくるのでしょうか。

 夏は一般的に多くの人にとって、受験勉強などで勉強に集中した時期だと思います。学校への登校をから解放されます。もちろん学校からは宿題が出されるので完全な学業面でのフリーとなるわけではないでしょう。しかし、登校して授業を受けるという日常は習慣化しているので気づきにくいのですが、思った以上に時間が取られるものです。つまり、夏は学校に行かなくて時間が増えるのです。自由な、自分が思う通りの時間が増えるのが夏なのです。日々のルーチンワークから解放される時期です。さまざまな日常的習慣からくるそれを行わなくてはならない義務から生じる圧力から解き放たれるそういう時期なのです。自由になると、認知リソースの空きがうまれます。Dutyに割かれていた知的なエネルギーがありあまってきます。この有り余ったエネルギーはどうしても消費したくなるものです。それが夏に使われるエネルギーの源なのです。

 消費されるエネルギーの向かう先はおそらく個々人で異なるものでしょう。私の場合は数学、勉強法に向かう何らかの無意識的な力が働いているのかもしれないとふと思いました。夏というのはにみんな受験の天王山などとして勉強することが推奨される時期です。予備校などの受験産業は夏期講習という形で大規模な宣伝活動を毎年行っています。多くの人が勉強に向かう意識が高まる時期です。そして多くのひとがそれを経験しています。つまり日本人の多くが10代においてこの経験を経ており、みな同じ時期に同じようなことをしています。この社会的文化慣習は10代に限定されずそれ以降の年代の人々にも影響を与えているのです。例えばサービスの提供側として関わるようになることもあります。一部の人は再受験や受験マニアなど消費者の立場の人もいます。言ってみれば、社会全体としてのある種の祭りとしての要素ともとれます。その祭りを取り巻くひとも参加します。こういった社会的な慣習により見込まれる需要を満たすように皆行動します。だからみな勉強に意識が向くということはあるかもしれません。

歯科治療についてしらべてみた

歯医者さんに通院して治療するのはなかなか大変なことです。虫歯になって、治療すると何回も通う必要もありますし、痛みを伴う処置も受けることもあります。ですから、虫歯にならないことがとても大切だと思います。しかしながら、悲しいことに歯磨きを毎日していても虫歯になってしまうこともあるのです。

そこで、虫歯になってしまう要因とそれへの対策について調べてみました。私はエビデンスを重視しているので、個人の感想や少数の歯科医の意見(開業歯科医のホームページ)といった情報は重要視していません。そこでエビデンスとして容易に参照できるものとして、日本歯科医学会がホームページで公開している歯科診療ガイドラインをまず、みてみました。

www.jads.jp

診療ガイドラインとして60件掲載されています。そのなかでいま知りたい虫歯つまり、う蝕についてのガイドラインを読んでみようと思いました。

う蝕治療ガイドライン第二版詳細版 日本歯科保存学会 2015年6月

2015年発行で8年前ですが非専門家でも容易に利用可能な文献としてはまだ優れています。

 

ガイドラインの冒頭にMI(Mimimal Intervention)を中心理念としているというのが記載されています。要するに必要以上に削るような治療はしないということなのでしょう。う蝕の中には進行が停止または治癒するものもあり、そういう病変は再石灰化療法での経過観察を勧めています。う窩を形成したう蝕のような進行を止められないような病変には最小の介入をと記載されています。冒頭のう蝕への基本方針はFDI(国際歯科連盟)の2002年の声明を引用してあり、このMIが世界的なう蝕治療へのトレンドであることが理解できます。

切削が必要なう蝕かの判断は歯科医による判断が必要であり、一般人が立ち入れるところではありません。ただ、歯科治療の大きなトレンドにおいて「最小の侵襲」が謳われていることは知っておいてよいと思いました。

ガイドラインで永久歯エナメル質初期う蝕へフッ化物塗布が強く推奨されています。引用されているインドの研究ではう蝕ハイリスク患者へ活動性白斑へリン酸酸性フッ化ナトリウム(12300ppmF)を塗布する群(年2回4分間)としない群でしたときには、80%が非活動性となり、3.5%がう窩となったが、塗布しないときは、35%が非活動性となり10%がう窩となったというのです。安価で安全なフッ化物を塗布するだけでう蝕進行が抑えられるのはよいというのは興味深いです。

また、初期活動性根面う蝕において、フッ化物配合歯磨剤+フッ化物配合洗口液の併用は根面う蝕の再石灰化に有効という研究も記載されています。フッ化物の使用はう蝕進展抑制の有用であり、日常的なフッ化物の使用の重要性が理解できます。

 

因果推論

最近因果推論の本などを読む機会が多いです。特に、「因果推論の科学」を読んでいるのですが、わかりやすくこれまでの統計に対するイメージががらりとかわる良書でした。

因果推論の科学 「なぜ?」の問いにどう答えるか

books.bunshun.jp

 

いままで統計を勉強してきましたが、いまひとつ腑に落ちない部分があり、それについてややもやもやが薄くなってきたように思います。

この本を読んでいて、「統計という学問は因果について排除してきた」という記述が気にとまりました。これまでXとYは関連があるなどの表現で歯切れが悪いなとなんとなく感じていたものが、統計学の因果を排除してきた歴史の部分について読むにつれて、因果関係をはっきりさせないのだから、歯切れがわるくなるのは当然だよなと感じました。

RCTでしか明確に因果について述べることはできないといった風潮があり、これについてはある種の絶望感を与えるものです。RCTは一般に大変な労力や費用がかかるものなので、科学的に重要な結論を出すにはRCTでの結果を待つというのが確かにゴールドスタンダードですが、これだと科学はごく一部のひとが実施できるものになってしまうような気がしていました。しかし、因果推論について学ぶと因果について言語を手にすることで、RCT以外にも因果について言及する方法があるというのがわかりました。これはかなりすごいことだと読んだときに思いました。

因果ダイアグラム、do計算法といった因果について言及するツールについて勉強していきたいと思いました。

正規表現 第二章 HTTP URLのリンク化

HTTP URLのリンク化
 

通常のHTTP URLをリンクに変えたい

↓/pathはオプション
 
$text =~ s{
\b
# URLを$1にキャプチャする
(
/path
)?
)
}{<a href=“$1”>$1</a>}gix;
 

空白、制御文字、<、>、(、)、{、}、などをのぞくほとんどの文字を表したい

[-a-z0-9_:@&?=+,.!/~*’%$]*
 

テキスト中のURLで末尾に句読点があるものは除きたい

否定の後読みをパス部の末尾におく
(?<![.,?!])
 

正規表現ライブラリ

qr演算子 正規表現正規表現オブジェクトに変換し変数に保存できるようにする
qr/…/

 

メモ

正規表現ライブラリも学習し、頭をつかってつくりだした正規表現をマスター化し再利用できる方法も解説しています。

正規表現 第二章 テキストからHTMLへの変換

2.3.6 テキストからHTMLへの変換

プレーンテキストをHTMLに変換したい

巨大文字列(テキスト全体が1つの大きな文字列)をつくりたい

undef $/;
$text = <>;
 
 

&,<,>をHTMLエンコーディングである&anp; , &lt; , &gt;へ変換したい

$text =~ s/&/&amp;/g;
 

段落を<p>で区切りたい

空行があいだにあれば段落の区切り
空行を見分けたい
↓^$は論理行の行頭と行末ではない
拡張行アンカーマッチモードをつかう
$text =~ s/^$/<p>/mg;
空行に空白文字があるとこれでは動作しないことがある
「^ *$」や「^[ \t\r]*$」を使う
 
空白を除いて空っぽの行の範囲をみつけたい
「^\s*$」を使うと連続した空行でも全体に1回でマッチする
 
 

メールアドレスを認識してmailtoリンクに変換したい

$text =~ s/\b(username regex\@hostname regex\b/<a href=“mailto:$1”>$1<\/a>/g;
 

ユーザー名とホスト名のマッチを正規表現で表したい

\w+\@\w+(\.\w+)+
 
↓ピリオドやダッシュがはいることがあるのでそれに対応させたい
\w+から\w[-.\w]*にする
 
↓最後の要素になるものを具体的にリストにして並べる
\w+(\.\w+)*\.(com|edu|info)
 
↓\wは適切でないことがあるのでホスト名につかわれる文字種を指定したい i修飾子付き
[-a-z0-9]+(\.[-a-z0-9+])*\.(com|edu|info)
 
$text =~s{
\b
#アドレスを$1にキャプチャする
(
usename regex
\@
hostname regex
)
\b
}{<a href=“mailto:$1”>$1</a>}gix;
 
・x修飾子:ほとんどの空白が無視される。#を先頭におくコメントがかけるようになる
Perlでは区切り子を自由に選べる。/のかわりに{}が用いることができる。

 

メモ

プレーンテキストをHTMLに変換する実用よりの例で学ぶ節です。メールアドレスの正規表現は厳密に行おうとするとかなり大変ですが、練習の題材に沿う範囲で正規表現として表していく構成です。ときどき新しい方法がでてきますが(x修飾子や区切り子の選択、拡張行アンカーマッチモード)、たいていはこれまで学んできたことで理解できます。

正規表現 第二章 肯定否定先後読み 読書メモ

先読みの別の例

JeffsになっているものをJeff'sに置き換えたい

s/\bJeff(?=s\b)/Jeff'/g
先読みの部分はsの前の位置へマッチ
 

後読みも併用する

(?<=\bJeff)(?=s\b)/'/g
どのテキストにもマッチせずアポストロフィを追加したい位置にマッチする。
マッチした無文字をアポストロフィに置換する
 

数値にカンマを入れる例

s/(?<=\d)(?=(\d\d\d)+$)/,/g
左側に何らかの数字 →(?<=\d)
ちょうど3個の数字 →\d\d\d
3個セットが複数あるとき →(\d\d\d)+
後ろに余計なものが続かないようにする →(\d\d\d)+$
 

単語の境界と否定の先後読み

より長い文字列の中に埋め込まれた数値にもカンマを挿入したい

肯定の後読み (?<=) 部分式が左側にマッチするときに成功する
否定の後読み (?<!) 部分式が左側にマッチしないときに成功する
肯定の先読み (?=) 部分式が右側にマッチするときに成功する
否定の先読み (?!) 部分式が右側にマッチしないときに成功する
 
語の境界:片側が\wで反対側が\wでない位置
単語の先頭:(?<!\w)(?=\w) 
単語の末尾:(?<=\w)(?!\w)
 

3桁ずつ数字をきりとる

s/(?<=\d)(?=(\d\d\d)+(?!\d))/,/g
 

メモ

先読み、後読みの例をさらに解説している節です。肯定と否定の先後読みも新しいものとしてでてきました。\bを先後読みで表現できることも説明されています。
 

正規表現 第二章 先後読み入門 読書メモ

 

kyoneco.hatenablog.com

 

2.3.5 先後読みによって数値にカンマを付け加える

大きい数字の列にカンマを挿入したい ex.112345 → 112,345

右から3桁ずつ数え、左側にまだ数字が残っていればそこにカンマを入れていきたい
カンマを装入する位置 = 右側に3も倍数個の数字があり、左側に何らかの数字がある位置のこと
先後読みで解決できる
 

先後読み構文:テキスト中の「位置」にマッチする。

先読み:テキストの先の方(まだ読んでない右の方)を覗き込んで、部分正規表現がマッチするかどうかを調べ、マッチするようなら正規表現要素として成功とする。

肯定の先読み:(?=・・・)

ex. (?=\d) 次が数値になっている位置で成功する
a1a →(置換b)→ab1a
 
ex.2 行頭が数字から始まっているものの先頭に・をつけたい
(?=^\d) 置換・
11
22
・11
・22
 
 

後読み:テキストの後ろの方(もう読んだ左の方)を振り返る

後読み: (?<=・・・)
ex.(?<=\d) 左に数値がある位置(数字の後ろの位置)で成功する 
a1a →(置換b)→a1ba 
 

先後読みで重要なこと:テキストを「消費」しないこと

マッチしたテキスト自体ではなく、マッチするテキストの「位置」をみつけるだけ。
ex.
ターゲット    Jeffrey 
正規表現     (?=Jeffrey)Jeff
マッチするところ Jeff
 

開き括弧シークエンス

(?:) キャプチャなしのグループ化
(?=) 先読み
(?<=) 後読み
 

メモ

先読みと後読みについて解説している節です。テキストの位置にマッチするというのがこれまで文字などをターゲットにしていたときとは異なるところです。この場所にこれをいれたいのにと思ったときには先後読みを使えばよいのです。位置へのマッチは^,$、\bもありますがより一般的な方法を知ることのできる節です。

正規表現 第二章 置換コマンドへの習熟 読書メモ

続きです。

 

kyoneco.hatenablog.com

 

2.3.4 ささやかなメールユーティリティ

 
やりたいこと
1.メッセージヘッダから必要な情報を抜き出す
2.返信のヘッダを出力する
3.行頭に’|> ’をつけて元のメッセージを出力する
 

<>演算子:通常の変数に代入すると入力の次の行が入る。getline()関数と同じ。<>ですべての入力を読み込むと未定義値を返す。

ex. while ($line = <>) {
}
 

タイトルを抜き出す

$line =~ m/^Subject: (.*)/i
.*は内容がなんであれ行ののこりの部分にマッチする。任意の文字の塊。かならず行末までマッチする。
()内は$1でアクセスできる。
 

アドレスまでの部分にマッチさせたい

^From: (\S+)
\S 空白ではないすべての文字にマッチする
 

括弧内の文字列にマッチさせたい。その際括弧自体もマッチさせたい。

\(([^()]*)\)
括弧はエスケープする必要がある。キャプチャのため、ターゲットの括弧内を括弧にいれる。
 

行頭に’|> ’をつけて元のメッセージを出力したい

while ($line = <>){
print “|> $line”;
}
 
別の方法
$line =~ s/^/|> /;
print $line;
冒頭の無文字を置換している。
 
 

メモ

Perlでのメールユーティリティプログラムの作成を通して、置換コマンドに習熟します。やりたいことを正規表現でどのように実現するかを考えるのがこの節です。具体的な問題を通して使い方を学んでいく構成です。

正規表現 第二章 正規表現によるテキストの書き換え 読書メモ

前回の続きです

 

kyoneco.hatenablog.com

 

 

2.3 正規表現によるテキストの書き換え


$var =~ s/regex/replacement/
正規表現が$varにマッチしたらマッチした部分を取り除きreplacementの部分をそこにはめる

 

・サンプル:ダイレクトメール


ダイレクトメールを製造したい。メールテンプレートにマーカーがつけて、そこにあとで変数を指定してはめ込み該当するマーカーを正規表現で置換する。
ex. Dear =FIRST=,
$given = “Tom”;
$letter =~ s/=FIRST=/$given /g;

/g: グローバル置換 最初の置換が終了した後もそこからさらにマッチを探して置換する

 

・サンプル:株価表示整形


「小数点3位までの使用でかつ3位が0である場合はそれを表示しない」ということをしたい。
$price =~ s/(\.\d\d[1-9]?)\d*/$1/
残しておきたい情報は括弧で囲って$1にキャプチャしてある。$の括弧の外にもマッチする部分があるが、$1への置換により削除される。

 

・自動編集


「遠隔でファイルの該当する文字列を置換したい」
perl -p -i  -e ’s/sysread/read/g’ file
-p: 指定したファイルのすべての行へ置換する
-i: 変更はすべてファイルに書き戻される
-e: プログラム全体がコマンド業のその後の位置に続いていることを示す

 

メモ


2章の続きですが、検索だけでなく置換も踏み込んだ操作について解説されています。
まずは置換の例として、ダイレクトメールのマーカー部分の置換について学びます。
次に、株価表示の整形として小数点3位までの使用でかつ3位が0である場合はそれを表示しないというケースです。すべて置換という操作できる例示がされています。

詳説 正規表現 第二章 正規表現をテキストにマッチさせる 読書メモ

正規表現 第二章 読書メモ その1
前回の続きです。

 

kyoneco.hatenablog.com

 

 

<序 Perlの簡単な解説>

Perl:1980年代に開発されたスクリプト言語。この言語のコンセプトはawk,sedから発展させたもの。
$:明示的な変数の宣言。 ex. $celsius = 30;
Perlではダブルクォート文字列の中に変数を書くことができる。ex. “$celsius C is …”;
 

正規表現をテキストにマッチさせる 今回の主題 (2.3にはいるまで)>

m/…./ :正規表現マッチする
=~ : 正規表現とターゲット文字列を結びつける.マッチすると読む。
ex. $reply =~ m/^[0-9]+$/
→^と$でかこむことで $reply全体が数字のみで構成されているかチェックしている
 

・もっと本格的に 負数や小数の値も受け付けられるようにしたい

  [-+]?      マイナス、プラス記号に対応
  (\.[0-9]*)?   小数部分に対応 
 

・マッチが成功したときの副作用 

  華氏と摂氏とちらの値も入力できるようにしたい
  末尾に[CF]と追加し、キャプチャするために括弧でくくる([CF]).$2にCかFが入る
 

・入り組んだ正規表現

  プログラムの変更で他の括弧が必要になったときに、
  変数の番号がずれてしまうことがある
  (?:...) キャプチャされない括弧をつかうこともできる
 

ちょっと寄り道 なんのメタ文字なのか 

   シェルにもメタ文字があるので異なるタイプのメタ文字をきちんと区別する 
・空白全般を表す\s
 

中締め

   \t タブ文字
   \n 改行文字
   \r 復帰文字
   \s 任意の空白文字
   \S \s以外のすべての文字
   \w [a-zA-Z0-9_] 単語にマッチさせるには\w+という形が便利
   \d [0-9]
   \D \d以外のすべての文字
   /i 大文字と小文字の区別がなくなる
 

メモ

この章の出だしはPerlをつかって具体的なプログラムが出来上がる過程をみながら正規表現について学んでいくという構成です。
そのプログラムは「摂氏と華氏の変換」であり、これのために正規表現をどのようにつかうかをみていきます。正規表現はプログラムへの入力の部分の妥当性のチェックに用いられています。仮想ユーザーが入力する数字等が変換計算に用いることができるかを計算部分の前にチェックするために正規表現を利用しています。

詳説 正規表現 第一章 読書メモ

テキスト検索や置換など正規表現は有用ですが、言語である以上慣れや習熟が必要です。

詳説 正規表現 第3版. Jeffrey E.F. Friedl 著、株式会社ロングテール/長尾 高弘 訳

を教科書として正規表現の理解を深めるべく読書メモを残しながら読んでみたいと思います。

 

正規表現 1章 正規表現入門

・言語としての正規表現

正規表現:パターン言語 (パターン:型、類型、 規則性を持った様式・体系、繰り返されるようす)
*:任意のものにマッチ
?:任意の1文字にマッチ

 

・言語との類似点


正規表現リテラルを単語、メタ文字を文法とする言語
メタ文字:特殊な意味をもつ文字(*など)
リテラル:その他の文字

正規表現という思考の枠組み

正規表現:小さなブロックのような単位を積み重ねて、組み立てる

 

・ファイルからのテキストの検索


egrep:正規表現が利用できるソフトウェア MAC Unixなど
コマンド:egrep [正規表現] [検索対象のファイル]
egrepは対象をみつけたら行全体を表示する

 

・egrepのメタ文字


行頭:^  意味:行頭がある場合、その次の文字と一致する行にマッチする
行末:$
^$:行が行頭をもつ場合、その次に行末が続くならマッチする。空行にマッチ。

 

・文字クラス


[]:複数の文字のどれか1つとマッチさせる.ex. [ab],[0-9],[Ss]mith
ダッシュ(ー)がメタ文字になるのは文字クラスの中だけ。

 

・否定文字クラス


[^]:リストに含まれていない任意の文字にマッチ。ex [^1-6] →789にマッチ

・任意の文字にマッチするドット
. :任意の文字にマッチする文字クラス ex.03.19.76 →03/19/76,03-19-76,03.19/76にマッチ

 

・選択 選択肢


| :またはという意味のメタ文字。複数の部分表現のどれかにマッチさせる ex.^(From|Subject|Date):
括弧によって範囲を限定させる

 

・大文字と小文字の違いを無視する


-i :大文字と小文字を区別しないマッチ
egrep -i [正規表現] [対象ファイル]

 

・単語の境界 単語版の^ $に対応


\< :語の先頭の位置にマッチ
\>:語の末尾の位置にマッチ
\<cat\> :単語の先頭の位置をみつけることができその次にcatと続きその次に単語の終わりの位置が続いたらマッチする。catという単語をさがせということ。

 

・オプション 量指定子


?:あってもなくてももよいという意味。ex colou?r →uがあってもなくてもマッチする 4(th)?

 

・繰り返し その他の量指定子


量指定子:くっついている要素の繰り返しの方法を指示するもの
+:直前の要素の1回以上の繰り返し
*:直前の要素の0回を含む繰り返し

 

・範囲指定繰り返し制御


{mini,max}:繰り返しの最小限と最大限を指定するメタ文字列 ex [a-zA-Z]{1,5}

 

・括弧と後方参照


括弧はその中の部分式にマッチしたテキストを覚えられるようになっている
1個の単語全般にマッチしたあとでさらに同じものにもう1回マッチしたかを検証したいときに役立つ
\1 :後方参照 括弧はその中の部分式がマッチしたテキストを覚えており、\1はそれに対応する
\<the the \> → 一般化 \<([A-Za-z]) + \1\>

 

エスケープ 


\ :メタ文字をエスケープするとメタ文字の特殊な意味は失われリテラル文字として扱われる

 

 

メモ

まずは言語として正規表現を捉えたときに、文字にあたるものと文法について第一章でまとめられています。基礎を発展させるの節では実例も挙げられていて、前半で整理された文法的知識がどのように実際に利用できるかが例示されています。メタ文字のまとめに挙げられている15項目を運用するのが正規表現の文法にあたるところです。これをどのように組み合わせてつかっていくかというのが肝になるでしょう。

不連続回帰デザイン

ランダム化比較試験(RCT)は内的妥当性が最も高い、つまり真の効果に近い効果を引き出せる研究デザインです。しかし、巨額な費用や手間などでそうやすやす行えるものではありません。最近ではいわゆるビックデータの利活用が注目されています。日常生活などに溢れる情報通信機器の普及によってデータはいたるところに蓄積されています。様々な分野でビックデータを利用して新しい知見の発見をという機運が高まってきています。蓄積されたデータというのは研究目的に集められたものではありません。すでに起こったデータをもとに興味のある現象を解析していくというスタイルをとることになります。つまり観察研究としての位置づけとなるわけですが、情報の多様さと多量さを武器に新しい発見をしていきます。これまで、観察研究はRCTと比べると一歩劣る存在としてみられてきましたが、利用の仕方によってはRCTを補うことやRCTでは実現できないことも示すことができます。観察研究でネックとなるのは交絡です。交絡の影響を排除する最も確実な方法はRCTです。一方、観察研究はRCTと異なり、介入の選択がランダムではないため、交絡の影響を避けられません。この交絡因子の制御について近年は様々な統計手法の発達してきています。様々ま手法が開発されてきていますが、興味深いと思った、不連続回帰デザインについて読んだ*ので、まとめてみたいと思います。

*医学論文の難解な統計手法が手に取るようにわかる本 

https://www.kanehara-shuppan.co.jp/books/detail.html?isbn=9784307004879

 

不連続回帰デザイン

1960年、Thistlethwaite and Campbellらが教育心理学の分野で初めて利用した統計手法。ある閾値をもとに特定の処置を行う状況で、その処置の効果を判定できる。処置の割り当てに関わる連続変数を割当変数という。割当変数の閾値近傍の対象者を集め、閾値以上と閾値未満の2群間でアウトカムを比較する。閾値から非常に近い両群の患者を集めてくることが重要。割当変数について、測定時閾値近傍で分けた2群は、処置するかしないかは偶然によりランダムに割り当てられたと考えることができる。その後の両群を追跡し、アウトカムを比較すれば処置の効果を推定できる。この手法の前提として、割当のルールと閾値がわかっている、介入前に割り当て変数を操作できない、閾値付近で介入「以外」の要因はすべて連続的な変化であるというものである。データ解析して得られた結果の一般化可能性は、割当変数の閾値付近の対象者に対してであり、閾値から離れるほど結果の当てはめはできなくなる。割当変数の幅を変えた何通りかの感度分析を行う。

例1:降圧薬の治療効果

収縮期血圧測定時、140mmHg以上で降圧薬開始するというルールと閾値があるとする。139mmHgと140mmHgの血圧の対象者は本質的に差があるわけでないと考えられるため閾値近傍ではランダムに降圧薬が割り当てられたと考えることができる。閾値近傍の2群を比較してアウトカム(脳卒中の発症率など)を比較する。

 

例2:ワクチン接種の医療政策の影響評価

ある年のある月から、あるワクチン接種が国による勧奨接種から個人による任意接種に変更された。ワクチンの対象は小児である。この政策変更によって小児の生年月日によってワクチン接種をうける確率が異なるようになる。政策変更の基準月の前に生まれたか後に生まれたかはランダムである。基準月に近い前後で2群に分けてアウトカム(ある感染症の発症率など)を比較する。この具体的な形式の具体例としてSmith Lmら CMAJ 2015がある。

統計モデリング

統計モデリングについて最近よく考えています。統計モデリングは、確率分布を利用して数理モデルをつくり現象の理解や予測を行う行為です。確率分布は統計モデリングにおいて構成要素となる重要な部品です。知りたい現象がどのような確率変数として表せ、どのような確率分布に従うのかを考える必要があります。つまり、確率変数を導入し、それがどのような確率分布に従うかを考え、モデル式としてそれを表現します。モデル式として表せたらシミュレーションすることができます。得られた推定結果を解釈して、知りたい現象の予測などに役立てます。この一連の過程が統計モデリングに含まれます。

知りたい現象、確率変数、モデル式のように分解して考えると理解が容易です。例えば、予測したいものとして、アイスクリームの売上があるとします。売上に影響を与える要素として、気温、天気、アイスクリームの価格が挙げられます。つまり、アイスクリームの売上 〜 気温、天気、アイスクリームの価格といった関係が想定できます。この予測においてもっとも単純なモデル式としては、この3つの要素のうち1つだけを使い、アイスクリームの売上 〜 気温といった関係を考え、線形モデルを考えるものです。そして気温は連続型の確率変数であり、どのような確率分布に従うかを考えると正規分布に従うとしてもよいでしょう。以上からモデル式として、アイスクリームの売上 〜 N(β0 + β1×気温, σ^2)が構築できました。あとは、データからパラメタの推定を行い実際の予測に役立てるようにします。

統計モデリングの過程でもっとも単純なものを考えました。より複雑なものを考えたいときにはどうしたらよいのでしょうか。線形モデルは仮定したまま、モデルの構造をかえたいときには、説明変数をかえることやデータの従う確率分布をかえることが考えられます。前者では上の例でいう気温をアイスクリームの価格にかえることです。また後者では、気温の従う確率分布を正規分布から、よりその確率変数が適合するであろう他の確率分布にかえることです。気温は正規分布がもっとも妥当に思えます。例えば、アイスクリームの売上 〜 アイスクリームの価格としてみます。価格は対数正規分布を仮定するように変更することはできます。こういったモデル構築について一般化し、確率分布の選択や従属変数への適合性を考慮した変換を加えるといったモデル構築が一般化線形モデルの考えにつながります。

 

本屋での体験 代理体験

最近本屋に関する面白い記事を読みました。

https://omocoro.jp/kiji/358099/

 

本屋に行くことは身近で経験できる文化的な活動と言えます。何か読みたい本があらかじめ決まっていてそれを探しに行き買うことがメインかもしれません。それ以外にも何も目的なく新しい本や雑誌との出会いを求めていくこともあります。上記の記事では後者の体験について大きな本屋での体験をRPGゲームのようにとらえてライター達の感じることやそれぞれの思いがかかれています。

大きな本屋はたくさんの本が並んでいます。どのように本を配置するかやきた人の興味を引くようにポップを置いたりするのも書店員の仕事です。書店員の考えていることも上記記事で語られていて興味深いです。立場を変えてもしくは相手の立場になってみて考えるというのは大切なことで自分目線だけではえられないまたは見えてこない視点がみえてきます。

小説を読んだりすることは想像の世界ではありますが主人公などに感情移入することであたかもそのひとになってその人の体験できるという経験です。本を読むことの効用としてこの代理体験はよく挙げられるものです。他者の気持ちを想像したり、なりきったりできる経験は他者とのコミュニケーションに役立ちます。他者が何をどう考えているのかそしてそれにどのように対応してその結果どういうことになったかというのはまさに一連のコミュニケーションの過程を体験することに他なりません。相手の気持ちを慮って対応しましょうと軽々しくいわれてもできません。でも現実世界で多くの人とコミュニケーションをとって実践できるかといえばそれも難しいです。小説などを通した代理体験によりそういったコミュニケーション能力というべきものが育まれるのでしょう。これについて芦田愛菜さんはよくネットでは人生2週目などといわれるように年齢に見合わないほどのコミュニケーションと深い見識をかんじます。特に対談形式のインタビュー記事では本当に上手に話を聞いて、話を聞き出している姿に関心します。彼女は幼少期から絵本をたくさん読んでいたようです。また役者であるため自分ではない他者を演じのが仕事です。この人生2週目といわれるほどの対応力は幼いときからのこういった活動からもたらされているのかもしれません。

自然実験の有用性

自然実験は、社会制度や歴史的な偶然から、あたかも原因が操作されたかのような状況を利用して因果関係を推定する手法です。2021年のノーベル経済学賞では、社会の変化の前後を比較し、労働市場の分野で業績を残したアメリカの大学の研究者3人が選ばれています。彼らは、
個人や家計、個々の企業単位をのデータを利用して、因果関係を推定し労働市場などにおける重要な社会問題に応用しています。

社会科学系の分野では自然科学の分野とは異なり、背景条件を厳密に調整して実験することが困難な場合が少なくありません。そこで、自然実験の手法が注目されるのです。自然実験の具体例についてまとめました。日本での例はネットを簡単に調べる限りあまり多くはありません。コロナウイルス感染症の流行は社会に大きな変化をもたらしました。これは一種の自然実験として各分野でさまざまな効果が検証されていくことと思います。

例1 生まれる月と教育年数の増加と所得との関係
米国では制度上の理由から10~12月生まれは1~3月生まれより義務教育期間が長い場合が多い。それを自然実験として教育が所得に与える因果関係を推定し、教育年数の増加は所得を増加させるとした。

例2 最低賃金の雇用に対する影響を推定した研究
最低賃金の引き上げは貧困対策として支持されるが、雇用を減らす懸念もある。ペンシルベニア州東部と同一の経済圏に属するニュージャージー州で、1992年に最低賃金が引き上げられた。このとき低賃金労働者が多いファストフード店の雇用変動を調べると、最低賃金が引き上げられたニュージャージー州の雇用はペンシルベニア州東部に比べ若干増えていた。

例3 ベトナム戦争への従軍経験が所得に与える影響
従軍経験の有無はお金を稼ぐ能力と独立とはいえない。体力のある人が軍に志願する場合や、民間での就職が厳しい人が軍に志願する場合もあるためだ。ベトナム戦争期間中の徴兵が一部くじ引きで行われたことを自然実験として行われ、従軍経験が所得を低下させたことが示しされた。

例4 キューバ難民のフロリダ州マイアミへの大量流入 アメリカ人の賃金の関係
キューバ難民のフロリダ州マイアミへの大量流入の状況が自然実験に用いられた。半年ほどの間に12万人ものキューバ難民がアメリカに到着した。マイアミの人口をおよそ7%増加させるほどの大きなインパクトであったにもかかわらず、マイアミのアメリカ人の賃金は低下しなかった。

例5 日本 生活保護の給付水準の「意図せざる」上昇が、労働者の労働供給に与える効果
市町村合併により級地が上昇した自治体では、最低生活費の外生的な上昇が生じる。市町村合併に伴う級地変更が就業率の変化に与える影響を検証した。 貧困率生活保護の受給傾向の高い、母子世帯および単身世帯に注目し、25〜49歳の配偶関係別、性別の就業率を検証した。結果、未婚の男女について、市町村合併前後の期間のみに、統計的に有意に就業率が低下した。

例6
日本では、69歳から70歳になると、外来患者が非連続的に10%上昇する。医療費負担が3割から1割に減るので、70歳になった途端に医者にかかる人が増える。

 

例7 ニュージーランド 深夜酒類販売規制後の暴行事件発生率の変化 自然実験

Addiction . 2021 Apr;116(4):788-798.  

深夜にアルコールを入手することを国が規制することが、週末の暴行による入院の変化やアルコール関連の暴行へのどのように影響するかみたもの。 規制後,週末の入院は 11%減少し15 ~ 29 歳で最も減少した。夜間に発生した警察記録に基づく暴行の割合は1.8%の減少がみられた。

 

例8 COVID-19に関連する学校閉鎖が青年期の睡眠に及ぼす影響:自然実験による検討

Sleep Med . 2020 Dec;76:33-35.

2020年のCOVID-19パンデミックの発生時、高校は閉鎖または遠隔授業に移行した。学校閉鎖が、定型発達の青少年の睡眠行動にどのような影響を与えたかをみたもの。通常通りの学校があるときと比べて、睡眠は2時間長くなり、睡眠の質の向上、日中の眠気の減少がみられた。高校の始業時間を遅らせることが、睡眠時間の延長、睡眠の質の向上、日中の眠気の軽減、就学中の青少年のストレス軽減に有効であることを示した先行研究と一致した結果だった。

 

例9 入院患者の高血糖管理における基礎-ボーラス型インスリン療法への変更-自然実験

Endocr Pract . 2019 Aug;25(8):836-845.  

入院中の高血糖を管理するために、スライディングスケールや基礎ボーラス式インスリン療法がある。後者の臨床的有効性について、2型糖尿病患者と新たに診断された2型糖尿病患者でその効果の大きさが異なるか評価したもの。ある大学病院に入院中の非重症の成人2型糖尿病患者10,120人を対象に,基礎-ボーラス型インスリン療法プロトコルを病院全体で実施する前と実施後の転帰を比較した。非重症入院患者の高血糖を管理するための基礎-ボーラス型インスリン療法の使用は,高血糖低血糖の両方を有意に減少させるにもかかわらず,新たに糖尿病と診断されたごく少数の患者を除いて,短期的な臨床転帰を改善させないことが示された.