有害コメントを分類する機械学習ツール(Perspective)

Kaminarimon / OiMax(Flickr)

2月23日、Alphabet傘下のGoogleと技術インキュベーター会社ジグソーJigsaw)は、コメント欄の誹謗中傷や嫌がらせ、不快なコメントを見つけ易くする機械学習ツールのパースペクティブ(Perspective)を発表しました。

現在、ヘイトスピーチ(憎悪表現)の取り締まりを迫られる米ニューヨーク・タイムズ紙や英ガーディアン紙、英エコノミスト誌といった様々なニュース発行者が、記事に寄せられるコメントを目視確認する際の補助ツールとして、試験運用しています。

パースペクティブは、侮辱的なコメントをより早く検出し、目視確認に役立てます。使用するアルゴリズムは、チェック担当者が「有害」と分類した数10万件のコメントで試されたものです。「有害」と分類されたものや、特定の人々を討論から締め出しかねないものにどれだけ類似しているかに基にコメントを採点する仕組みです。

ニューヨーク・タイムズ紙が試験運用を行った結果、担当者が同じ時間で2倍の量のコメントをチェックできたそうです。ジグソーのルーカス・ディクソン氏は「目標はチェックのスピードを10倍にすることだ」と述べています。

機械学習ツールの Perspectiveは、何が有害で何が有害でないかを学習するために、これまでに膨大な数のコメントを確認しています。下記の実験では、コメントの有害度合をスライダーを動かすことで容易に分類できます。

Here we’ve used Perspective to organize comments on three topics that are often difficult to discuss online. Use the slider to explore. / Jigsaw

ウィキペディアのノートページから収集された悪口を、アルファベット(グーグルの親会社)とウィキメディア財団の研究者が10万件以上の温和な投稿とともに、データ集として公開しています。女性蔑視や人種差別、罵倒など、ネット上で個人を攻撃している投稿1万3500件以上のコレクションが完成しています。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です