bohemia日記

おうちハックとか画像処理、DeepLearningなど

アメリカの警官の対応における人種差別に関する研究 

こんにちは。ぼへみあです。

最近ネット界隈では、警官の対応のまずさが話題になることが多い気がします。

www.sankei.com

cpplover.blogspot.jp

先日ハワイで行われたCVPR2017というコンピュータビジョンのトップカンファレンスに行ってきたのですが、その基調講演でアメリカの警察と住民のコミュニケーションに関する研究が紹介されていて、とても面白かったので紹介したいと思います。
簡単に言うと、アメリカの警察はボディカメラの着用をしており、会話や行動が記録されています。その会話データから、黒人と白人への対応の違いを研究、警察と協力してトレーニングに活かそうという、日本じゃまだまだ考えられないような先進的な内容でした。

講演はスタンフォード大学のDan Jurafsky先生によるもので、Youtubeですべて見られます。

youtu.be

研究概要

この研究は、心理学、言語学、コンピュータサイエンスなどの専門家のプロジェクトです。
アメリカにおいて、黒人コミュニティに属する人は、他のグループよりも警察にネガティブな扱いを受けているという研究結果があります。特に公平でない車両停止の命令を受けたことがあると回答する割合は、黒人で18%, 白人で3%となっています。
そこで実際のコミュニケーションに基いて研究するために、オークランド警察が2010年より警官に着用し続けているボディカメラのデータを使って、車両停止の際のコミュニケーションの分析を行いました。

警官の白人に対する敬意は、黒人のそれと異なるか?

警察が走行中の車両を止めて、会話する場面での会話を考えます。

以下の2つの警官の対応で、どちらが相手に敬意を持った対応でしょうか?
f:id:bohemian916:20170824145411p:plain

適当な訳:
上: 手をハンドルの上に置け。武器は持っていないか? この車はお前のものか?

下: 今日はいかがお過ごしですか、奥さん。今日私が車を止めたのは、あなたが運転中に電話をしていたからです。


もちろんBのほうが、相手に敬意を持った対応といえるでしょう。

アメリカの警察は、相手に対する敬意を重視しています。敬意を持った対応は、警官に対する信用、検査に対しての前向きな態度、支援が得られるからです。
そこでまず、後の機械学習の学習データにするためにも、人の評価者が警官の発話を聞くことで、どの程度敬意を評価できるか検証しました。

対象のデータは、オークランド警察の警官245人, 414個の会話を書き起こしたもの。個人情報が入ると困るので、警察署内でダメな書き起こしてダメな情報を削除したそうです。その発話で警官はどの程度敬意を持って対応しているかを4段階で評価しました。評価する項目は、

  • Formality (形式的さ)
  • Friendliness (友愛度)
  • impartiality (公平さ)
  • Politeness (丁寧さ)
  • Respectfulness (尊重さ)

の5項目です。

結果として、70人の評価者の評価は、73-91%で一致し、評価したすべての項目で白人への対応の評価が黒人のそれを上回っています。 f:id:bohemian916:20170824134539p:plain

計算言語学的アプローチ 機械学習による分類

人手で判断していては、多くのデータを解析できないため、機械学習による分類でスケールさせます。

相手に対する礼儀正しさは、言語学モデルにおいては、ポジティブな礼儀正しさと、ネガティブな礼儀正しさに分けられます。

ネガティブな礼儀正しさとは、この図のようなものです。
f:id:bohemian916:20170824140203p:plain

簡単に訳すと、

  • 謝罪:すみません、おっと、私のミスだ
  • 感謝:ありがとう、嬉しいです
  • 負担の軽減:大丈夫、心配しないで、大したことないよ
  • ためらいがちな言葉:ちょっと,少し、みたいな
  • 丁寧でない例(行動を支配する):ハンドルに手を置きなさい

というものです。

逆にポジティブな礼儀正しさとしては、 f:id:bohemian916:20170824140421p:plain

のように、

  • 敬称:〜さん、 vs おまえ、兄弟など
  • 姓or名(姓のほうが丁寧)
  • 自己紹介:こんにちは、私は警官の〜〜です
  • ポジティブな承認:間違いなく、絶対、素晴らしい

などがあります。

こうした表現を抽出する分類器を学習させます。また、どういった表現が相手への敬意につながるのか、または無礼とみなされるのか、先の人手で作った評価指標を学習データとして、線形回帰で重み付けを学習します。するとこのような重み付けになるようです。

f:id:bohemian916:20170824144412p:plain

右の青いものは、この表現があると相手に敬意を持った対応をしているとみなされるもの、
左の赤いものが、逆に相手に敬意を払っていないとみなされた表現です。

この重みを元に、その会話がどれだけ敬意を持った対応かを自動でスコア付けします。
例えば、敬いがない発話だと、このようにマイナス評価になり

f:id:bohemian916:20170824150627p:plain

逆に敬意があるとされた表現が入っていると、プラスになります。

f:id:bohemian916:20170824150731p:plain


これを残りの36,738例の発話に対して行い、相手が白人、黒人の場合で分けて可視化してみると、このような結果になります。
f:id:bohemian916:20170824151013p:plain

左が先程の重み付けのグラフで、右がそれぞれの表現の出現率の差となります。
黄色が白人に多い表現、緑が黒人に多い表現です。
白人に対しては、安全を祈られる、所属を名乗られる、安心させる表現など敬意があるとされた表現が明らかに多く、
黒人に対しては、ハンドルに手を置け、不適切な呼び方、質問が多く、敬意がない表現が多くなっています。

他にも、車両停止の結果(逮捕、警告、召喚)、近隣の犯罪率、年齢、警官の人種など様々な軸で検証しましたが、 敬意に明らかな違いが見られたのは、白人と高齢者だけでした。

このように、黒人と白人に他する表現が大きく異なることが明らかにされました。

継続中の研究

その他研究中のテーマとして、敬意の表現ではなく会話のイベントを検出して差別を判断する研究をしています。
例えば、

  • 挨拶
  • 車を止めた理由
  • 免許証の提示
  • 車の所有者
  • ここにいる意図

などの21のイベントを発話から解析し、白人と黒人の比較を行っています。
現在出ている結果としては、以下の図のようになっています。
f:id:bohemian916:20170824153754p:plain

白人に対しては、挨拶、警告、車を止めた理由を教えてくれることが多く、 逆に黒人に対しては、免許証提示、ハンドルに手を置く指示、執行猶予の有無、車の所有者、属性を聞くなどのイベントが多く、 対応に大きな差があることがわかります。

また現在は書き起こしたスクリプトを用いていますが、これを音声認識の技術で置き換える研究が進んでいます。 イベント検出のタスクにおいて、書き起こしがF値75%に対し、音声認識のみだとまだ54%だそうです。

最後に

日本では、警官とのやり取りは録音すらされず、誰かが録音して公開したり、訴訟しない限り問題が明らかになっていません。 その一方でアメリカは、録音撮影はもちろん、人種差別の撤廃のため、警官とのコミュニケーションを改善させるためにこれほどの研究が行われており、レベルが違うと思いました。
音声認識での解析も進められているので、将来は警官の音声が常時クラウド送られて、ダメな対応があればすぐに検出される世の中になりそうです。 ボディカメラの着用義務化で警察への苦情が100%近く減ったという事実もあり、日本も少しづつでもいいので導入して欲しいところです。



記事書いた後に、Techcrunchの記事があったの気づいた・・・

jp.techcrunch.com