2月23日、Alphabet傘下のGoogleと技術インキュベーター会社ジグソー(Jigsaw)は、コメント欄の誹謗中傷や嫌がらせ、不快なコメントを見つけ易くする機械学習ツールのパースペクティブ(Perspective)を発表しました。
現在、ヘイトスピーチ(憎悪表現)の取り締まりを迫られる米ニューヨーク・タイムズ紙や英ガーディアン紙、英エコノミスト誌といった様々なニュース発行者が、記事に寄せられるコメントを目視確認する際の補助ツールとして試験運用しています。
パースペクティブは、侮辱的なコメントをより早く検出し、目視確認に役立てます。使用するアルゴリズムは、チェック担当者が「有害」と分類した数10万件のコメントで試されたものです。「有害」と分類されたものや、特定の人々を討論から締め出しかねないものにどれだけ類似しているかに基にコメントを採点する仕組みです。
ニューヨーク・タイムズ紙が試験運用を行った結果、担当者が同じ時間で2倍の量のコメントをチェックできたそうです。ジグソーのルーカス・ディクソン氏は「目標はチェックのスピードを10倍にすることだ」と述べています。
- How can technology make people in the world safer?(Website)
- Perspective API(Website)
- Google Cousin Develops Technology to Flag Toxic Online Comments(The New York Times)
機械学習ツールの Perspectiveは、何が有害で何が有害でないかを学習するために、これまでに膨大な数のコメントを確認しています。下記の実験では、コメントの有害度合をスライダーを動かすことで容易に分類できます。
ウィキペディアのノートページから収集された悪口を、アルファベット(グーグルの親会社)とウィキメディア財団の研究者が10万件以上の温和な投稿とともに、データ集として公開しています。女性蔑視や人種差別、罵倒など、ネット上で個人を攻撃している投稿1万3500件以上のコレクションが完成しています。
- 悪口とは何か? 機械学習用に荒らしコメント1万3500件を収集(2/8 MIT TECHNOLOGY REVIEW Japan)