機械学習により有害コメントを判定するGoogle/JigsawのPerspectiveだが、人間が元の意味を認識できる程度に微妙な改変を加えたadversarial exampleを使用することで、判定を混乱させる攻撃に関する研究結果が発表された(論文: PDF、 Ars Technicaの記事、 The Registerの記事)。 現在のところ、Perspectiveは研究開発初期の段階だが...
関連記事
「Claude」の“偽サイト”登場 「日本語無料版」など巧みに誘う すでに閲覧不能も検索順位の高さは脅威
ITmedia NEWS セキュリティ
東大研究室のサーバに不正アクセス
ITmedia NEWS セキュリティ
iPhoneを狙う高度なハッキングツール「Coruna」発見 米政府から流出、犯罪集団の手に渡ったか
ITmedia NEWS セキュリティ
カラー、エヴァ30周年フェスで上映した短編アニメをYouTubeで公開 流出動画対策か
ITmedia NEWS セキュリティ
詐欺師がうっかりミス? “詐欺メールのデザイン”のポイントを誤表記 あるフィッシングメールが話題に
ITmedia NEWS セキュリティ
はてブのコメント(最新5件)
loading...