この記事は、みらい翻訳Advent Calendar 2024の23日目です。
こんにちは。プロダクトマネジメント室の八木(X: @TehTalikAis)です。社内ではChuaと呼ばれています。
社内ではデータサイエンティストとしてマーケティングとプロダクト開発に関わるデータ分析をしている傍ら、今年(2024年)の4月から京都大学大学院アジア・アフリカ地域研究研究科(以降、ASAFASと呼びます)東南アジア地域研究専攻の博士課程( 岡本ゼミ)に所属しております。また、8月より京都大学東南アジア地域研究研究所(以降、CSEASと呼びます)の連携研究員にもなりました。三足目の草鞋は頭にでもかぶろうと思います。
当該研究科では東南アジア政治の定量的・定性的な研究をしています。特に、マレーシアやインドネシア、フィリピンの政治や権威主義体制(独裁制)に関する定量的な調査や分析、およびそれらを実施するための方法論の開発をしています。
主に平日はフルタイムで働きながら、業後および休日に社会人博士、および連携研究として研究をさせていただけてます。会社に感謝です🫶
以前、『社D、はじめました。』というタイトルで社内ブログに寄稿しましたが、今回は生存報告です。会社や家族、大学および研究所など様々な人のご理解もあってなんとか無事に研究をさせていただけてます。
miraitranslate-tech.hatenablog.jp
さて、今回は社Dとしてどんなことができているのかをお話しします。具体的な成果としては次のようなものが挙げられます。
1. [IDEスクエアへの寄稿]TikTokがインドネシアの選挙に与えた影響の定量的な分析(指導教官、共同研究者との共著)
2. [学会発表]大規模言語モデル、統計的因果推論、感度分析を用いた再現性の高い仮説探索と仮説検証の提示
3. [学会発表, 採択済み, 2025年1月報告予定]経済操作がマレーシアにおける有権者の選好に与える影響の定量的な分析
元々は統計解析や時系列解析を用いたオーソドックス(?)な選挙分析を行っていたのですが、指導教官よりオンライン空間上の言説や動態の分析もやった方が面白いし自然言語処理とか覚えたらどうかを言われ、昨年12月からこうした技術の習得に励んできました。(まだまだ全然できてないのですが)いくつか成果を対外発表に持っていけたことは良かったなと思いました。
一方で今作っている方法論はまだ完成できていないので、ここの部分を来年度中には査読付き論文にしたいです。
個人的には①大規模言語モデル、②マルチモーダルAI、③知識グラフを使って私が所属している地域研究ではまだまだ未開拓のデータを分析して新しい知見を引き出すことに注力していきたいのですが、他にはジャック・デリダのような先鋭的な思想やそれらが目指していること(いわゆる脱構築的な考え方)と定量的な分析を接合していきたいです。
※脱構築的な考え方が突然出てきたので少し補足をします。私の研究ではマレーシアにおける政治を中心に取り扱っています。マレーシアでは長らく民族間対立が政治的な争点となってきました。民族間対立が他の領域とも不可分に混じり合っており、民主主義の発展など、本来解決されるべき問題が民族間対立によってマスクされてしまっている状況が見られます。こうした状況を打破するためには所与のものとなってしまっている民族間対立が一体なぜ生じているのか、それは本当に絶対的な問題なのか、といった前提を問い直す必要があり、脱構築的な考え方はそれを行う一つの方法となるのではないかと考えています。
統計や機械学習、およびそれらを支える数学の知識をもっと拡充するとともに、哲学的な議論をもっと深く知っていきつつ、政治学の研究を体系的に調査しつつ、地域研究で今どんなことが議論されているのかをチェックする日々はとても刺激的で楽しいです。
願わくば、特に定量的な調査手法で得られたことをもっと業務にも活かせるようにしたいですね。もっと視野を広く持っていこうと思いました。
それもこれも周囲の協力のおかげであり、心身の疲れを愛ハム(家にハムスターが4匹います)に癒してもらえてるからだというのを改めて思いました。
最後に、生存報告を通してお伝えしたかったことは社Dはフルタイムの博士と比べて使える時間が少ないのですがその分日々の研究活動に喜びを見出せるというのではないかということです。社D、やっぱり楽しいです!
We are hiring!
みらい翻訳では、私たちと一緒に機械翻訳のプロダクトづくりを進めていただけるエンジニアを募集しています! ご興味のある方は、ぜひ下記リンクよりご応募・お問い合わせをお待ちしております。