機械翻訳エンジン研究開発チームのマネージャーを務めているlisaです。機械翻訳エンジンの不具合解消や新機能実装を監督しながら、中長期的なエンハンスメントのために機械翻訳の論文を読む日々です。とは言え、今年に入ってからまだ100本くらいしか読めていないので、もう少し精進しなくてはなりません。
ところで、最近AmazonのオーディオブックサービスであるAudibleにハマっています。Audibleの良いところは、月1500円で多くのビジネス書が聴き放題対象になることです。筆者は、例えば洗濯物を干したり、化粧や筋トレをしたりしながら、Audibleで興味のある本を2倍速で聴き流し、本当に気に入ったものは後でKindle版を購入して詳しく読む…という使い方をしています。つまりAudibleだけで情報収集するというよりは、「あとで読む」用の本を選ぶためにAudibleを使っているわけです。
このようなAudibleの使い方をしていて、ふと「論文も同じやり方で『あとで読む』ものを選べるのではないか?」と思ったのが、この記事の始まりです。
やりたいこと
今回個人的に満たしたかった要件は以下です。
1. arXivにある最新の機械翻訳関連論文の概要を読み上げてくれる
- Audibleと同様、PCやスマホから手を離している時に聴き流したい
- あくまで「あとで読む」ものを選ぶのが目的なので、大まかに何の課題を解こうとしているかわかれば良い
2. iPhoneで動作する
- Amazon EchoやGoogle Homeは持っていない
3. 日本語に自動翻訳してくれる
- arXivの論文はほとんどが英語
- 一応、元の英語が読める程度の英語力はあるのですが、アイラインを引いたり、スクワットの姿勢に注意を払ったりしながら英語を聴くのは辛い
4. 読み上げ速度を変更できる
できたもの
早速ですが、こちらが上記の要件を満たした完成品です。(実際、思いついてから30分くらいで出来た)*1
処理内容
iPhoneのショートカットという、IFTTTのようなオートメーションツールを使って下記の処理を順次自動実行しています。(上記の動画はショートカットを起動してから、1番目の論文の翻訳結果を読んでいるところの途中まで収録)*2
- arXivのAPIを利用して、要約に「translation」を含む新着論文のリストをRSS形式で取得*3
- 上記で取得した論文情報を、iPhoneの翻訳アプリで日本語に翻訳する
- 日本語に訳した結果をSiriが読み上げる
具体的なショートカットの設定内容は下記の通りです。
順次読み上げるだけでは、後で「途中でなんか面白そうな論文あったけどなんだっけ?」となる展開が容易に予想されるため、最後に元の英語の論文要約を一覧表示しています。
ショートカットの設定で読み上げスピードを自由に設定することも可能です。冒頭の動画ではデフォルト設定よりも速めの読み上げスピードに設定してあります。
今後の課題
このように要件通りのものが無事に出来たわけですが、残された課題もいくつかあります。
論文のタイトルや著者情報が読み上げられない
元のRSSには論文のタイトルや著者情報も含まれているのですが、なぜか要約しか読み上げられません。やり方わかる方いらしたら教えてください。
専門用語がうまく読み上げられないことがある
仕方のないことではあるのですが、専門用語が正しく読み上げられないことがあり、聞いていてちょっとびっくりすることがあります。冒頭の動画の中でも「資源の少ない環境で『ネ』を翻訳することは依然として課題です (原文: translating NE in low-resource setting remains a challenge)」という箇所があったことにお気づきの方もいらっしゃるのではないでしょうか?ここで言う「ネ」はnamed entities*4の略である「NE」のことで、日本語では通常「エヌイー」や「固有表現」と呼ばれるものです。読み上げの辞書のようなものが設定できるとより良いのかもしれません。
また、読み上げ以前の機械翻訳で、上記のnamed entitiesのような専門用語が適切な日本語に訳されない場合もあります。これは機械翻訳の一般的な技術課題であり、本業のエンジン開発の中でも取り組んでいきたい、本当の「今後の課題」です。
おわりに
これで日々の暮らしの中で無理なく機械翻訳の論文を読んでいけることを期待しています。しばらく運用してみて、アップデートがあればまたご報告させてください。
当エンジニアリング部では自然言語処理リサーチャーとエンジニアを募集しています。面白い機械翻訳論文を見つけられた方は、ぜひカジュアル面談で教えてください。