@DINDIN92 Profile picture

Yuu Jinnai

@DINDIN92

強化学習の研究をしています🐈

Similar User
まむ photo

@mamurai1208

Kenta Oono photo

@delta2323_

Yoshitaka Ushiku photo

@losnuevetoros

Weihua Hu photo

@weihua916

myamada0 photo

@myamada0

smly photo

@smly

kota matsui photo

@matsui_kota

Naoto Inoue photo

@naoto_inoue_

某ことり photo

@ktrmnm

Hiroharu Kato photo

@hiroharu_kato

中川裕志 photo

@hiroshnakagawa3

Daichi Mochihashi photo

@daiti_m

Yuki Arase (荒瀬 由紀) photo

@Yuki_arase

HELLO CYBERNETICS photo

@ML_deep

とっとこ豆乳さん photo

@SoyMilkBayesian

Yuu Jinnai Reposted

どうも今日だけKindle版が499円 (86% off) らしいです. 金森敬文, 鈴木大慈, 竹内一郎, 佐藤一誠『機械学習のための連続最適化』 amazon.co.jp/o/asin/B0756RT…


明日からIBIS 2024 #IBIS2024 です! CyberAgent AI Labからは9件の発表があります! 私が携わっている3件はいずれもLLMのアライメントに関する研究です。ぜひポスターにお立ち寄りください!👍

Tweet Image 1

甘利先生の講義が東大のオンライン講義サイトにあった。情報幾何の気持ちがちょっと分かったような気がする。 ocw.u-tokyo.ac.jp/lecture_762/


銅谷先生のノーベル賞に寄せてのメッセージとても良いですね。 jnns.org/2024/10/22/%e4…


Yuu Jinnai Reposted

Swallow Projectの新しいモデルをリリースしました! Llama-3.1からの継続事前学習モデルとそのInstructモデルです。特に従来のSwallowのモデルと比較して指示追従性能(Japanese MT-Bench)がかなり改善されています。 huggingface.co/collections/to… 学習の詳細は以下をご覧ください…


Yuu Jinnai Reposted

/ 【AI Lab】リサーチインターンシップ2024  冬期募集のお知らせ \ 博士後期課程の学生を対象とした、リサーチインターンシップの冬期募集を開始。24の幅広い研究テーマの中から、AI Labの研究員とともに様々な技術課題へ挑戦いただけます。ご応募をお待ちしております! cyberagent.co.jp/news/detail/id…


確率論と統計学と幾何学と情報理論の勉強をしたいな~


Filtered Direct Preference Optimization Paper: arxiv.org/abs/2404.13846 Code: github.com/CyberAgentAILa… #EMNLP に採択されました!🎉 クオリティの低いデータを取り除くことでDPOを効率化させる研究です。

Tweet Image 1

RLHFの研究成果がEMNLPに採択されました! arxiv.org/abs/2404.13846 LLMアライメント(RLHF)の標準となりつつあるDPOは、学習データに質の低い応答文が含まれると、従来のRLHF以上に性能が劣化することを確認し、これに対処するためデータをフィルタリングするFiltered DPOを提案しました。



Yuu Jinnai Reposted

We have opened the application for the poster presentation of OIST ML workshop 2025! omlw2025.mlds.jp/application/ We will provide accommodation at the seaside house for the selected poster presenters. So, please consider submitting your poster and come to beautiful Okinawa!

Tweet Image 1

Yuu Jinnai Reposted

#YANS2024 のチュートリアル講演『ニューラルネットワークの損失地形』のスライドを公開しました speakerdeck.com/joisino/landsc…


日本のアニメ・ゲームなどを扱ったテキストデータセットを一緒に作ってくださる方を募集中です! 応募者がない場合「30代男性の選ぶ懐かしの2000年代アニメデータセット」になってしまいます!皆様のご応募を待っております!

\ AI Lab強化学習チームでインターンシップを開始 / AI Lab強化学習チームで全学年対象のインターンシップの募集を開始しました! 日本のポップカルチャーデータセットの構築に興味がある方はぜひ求人をご覧ください。 hrmos.co/pages/cyberage…



Yuu Jinnai Reposted

We released mbrs v0.1.3 and the demo paper🎉 GitHub: github.com/naist-nlp/mbrs Paper: arxiv.org/abs/2408.04167 Docs: mbrs.readthedocs.io/en/latest/inde… Recent changes: - Reference aggregation (DeNero+, 2009; Vamvas+ @j_vamvas, 2024) - Diverse MBR (Jinnai+ @DINDIN92, 2024) - YAML-based config


適当なお店で頼んだ野菜炒め的な料理が爆裂に辛かった🔥 at Bangkok


東京暑すぎる


ACL2024でテキスト生成に関する論文を2本発表します! また、Cross-Cultural Considerations in NLPというWorkshopで「日本語LLMを英語データセットで事後学習すると日本における常識に関する理解はどう変化するか?」というテーマの論文を発表する予定です👍 そちらもぜひ! arxiv.org/abs/2406.16316

AI Labの三田雅人および陣内佑らによる論文が自然言語処理分野の国際会議「ACL 2024」の本会議に1本、Findingsに2本採択されました。なお当社において、「ACL」本会議での論文採択は初となります。 cyberagent.co.jp/news/detail/id…



Yuu Jinnai Reposted

研究員雇用する枠があるので、もしご興味ある人いたらDMください。 まず、機械学習の研究ができるのが大前提で、その上で自分の研究を進めるだけではなくて、他のチームメンバーを助けたりとかチームを盛り上げて下さる人にきてもらえると嬉しいです。詳細な条件は続きます。


ACLの「7日後にポスターとプレゼンの動画を上げといてね」は厳しすぎませんか?そもそも来週はICMLなのでどちらかを犠牲にしないといけない 道長かよ~


Yuu Jinnai Reposted

Updated mbrs: github.com/naist-nlp/mbrs… This release includes many new features: - Support XCOMET - Support BLEURT (thanks to Luca Di Liello!) - Add Probabilistic MBR (Trabelsi et al., 2024) - Add Model-Based MBR (Jinnai (@DINDIN92) et al., 2024) - Support standalone evaluation

Tweet Image 1

Loading...

Something went wrong.


Something went wrong.