Omiita
@omiita_atiimoML Engineer / M. Eng. / Book: "Vision Transformer入門"(https://t.co/V9mJEOQp7q) / Blog: https://t.co/nEStqseyZK
Similar User
@hillbig
@ogawa_yutaro_22
@CVpaperChalleng
@ai_scholar
@DL_Hacks
@SaitohKoki
@goto_yuta_
@stateofai_ja
@ImAI_Eruel
@PreferredNetJP
@sammy_suyama
@shinmura0
@AkiraTOSEI
@icoxfog417
@mi141
We're releasing a preview of OpenAI o1—a new series of AI models designed to spend more time thinking before they respond. These models can reason through complex tasks and solve harder problems than previous models in science, coding, and math. openai.com/index/introduc…
Llama 3.1 is here! 8B, 70B, and 405B versions are available.
Llama3(70B/8B)出ました。 llama.meta.com/llama3/ • 70BはClaude 3 Sonnetに勝ってる模様 • 8BもMistral/Gemmaを圧倒していて、期待を上回る性能 • さらに進行形で400Bも学習中とのこと。すでにClaude 3 Opusにも並びそうなベンチマーク結果を叩き出している
LLMをチューニングしたい人にとって、かなり有益な内容でした。非常に勉強になりました。 レポ: github.com/hiroshi-matsud… #NLP2024
本日13:00にスタートする #NLP2024 で「チュートリアル3:作って学ぶ日本語大規模言語モデル」の講師を私が担当します。日本語LLMの成り立ちについて、学習・推論の実行方法を含めて解説します。 anlp.jp/nlp2024/#tutor…
Introducing Sora, our text-to-video model. Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. openai.com/sora Prompt: “Beautiful, snowy…
中国語のベンチマークで、GPT-4超えモデルが出てきたとのこと。 ユーザーによる報告のため鵜呑みにできないかもしれないが、 中国語ではGPT-4/ChatGPT超えモデルがいくつか出ているのはすごい。 (中国語を主言語としていないGPT-4/ChatGPTもすごいのだが。) cevalbenchmark.com/static/leaderb… (↑PC推奨)
rinnaからも36億パラメータの日本語LLMが出てたのか! しかもinstruction-tuningしたバージョンも出してくれている。(ありがとうございます!) 日本語LLM界隈、最近きてるな huggingface.co/rinna/japanese…
日本語で事前学習されたLLMは激アツすぎる。しかも商用利用可能! ありがとうございます!
当社が開発した「最大68億パラメータの日本語LLM」を商用利用可能なライセンスで公開いたしました。本モデルをベースにチューニングを行うことで、対話型AI等の開発が可能です。 今後もモデル公開や産学連携を通し、国内における自然言語処理技術の発展に貢献してまいります。 cyberagent.co.jp/news/detail/id…
ついにLLaMA-7Bと同等の性能を持つ商用利用可能なLLM「MPT-7B」が登場! ブログ:mosaicml.com/blog/mpt-7b デモ:huggingface.co/spaces/mosaicm… 下図はZero-shot性能の結果です。StableLM / Pythia / Cerebrasなど最近の商用利用可能なLLMと比べてもMPT-7Bがかなり良いことが分かります。
なんと第4刷!ありがとうございます! Self-AttentionやVision Transformerの仕組みをゼロから理解したい方はぜひ!
【好評につき第4刷】片岡裕雄さん 監修,山本晋太郎さん,徳永匡臣さん,箕浦大晃さん,邱玥さん,品川政太朗さん 執筆の『Vision Transformer入門』の増刷が決定!注目のViTのしくみと応用先がわかるとともに,コンピュータビジョン分野の最新状況を概観できます。gihyo.jp/book/2022/978-…
ぼく 「ジピったけど、これ少しハルってんなぁ」 ※ハルシネーション(hallucination、幻覚): 言語モデルがもっともらしい嘘をつくこと
とんでもなく有用なまとめだ… ありがとうございます!
現状のLLMの流れ ①マイクロソフトのBing VS GoogleのBard→検索エンジンの戦い ②オープン(メタのLLaMAとかGPT-J、GPT-NEOX、Cerebras-GPT) VS クローズ(ChatGPT, GPT-4, LaMDA,…
GPT-4、爆誕。 openai.com/product/gpt-4 GPT-4は、テキストと画像を受け取れるマルチモーダル。自然言語処理タスクでは、これまでの最高性能モデルたちをGPT-4が Few-shotで大幅に超えてる! そして、論文の画像入れたらその要約返してくれるのエグいな
Olive Gold Vision Transformer 入門みたいでかっこいいな
ChatGPTのRLHFなどでも話題の強化学習ですが、強化学習はこの本がとんでもなく分かりやすいです。 amzn.asia/d/f71Jbhn 著者の斎藤さん(@SaitohKoki )の解説が秀逸で非常にクリアになりました🙏 ゼロから作るDeep Learning ❹ ―強化学習編
日本語特化版のチャットボットを@StabilityAI_JP が作るらしい これもStableDiffusionと同様にオープンソース&使いやすいモデルになったら大流行間違いなしだな
日本語に特化した、今までないチャットボット「Stable Chat(日本語版)」を開発します! 世界トップクラスの技術、大規模GPUクラスター、オープンコミュニティの力など… 私たちの強みを生かした透明性の高い最高の大規模言語モデル(LLM)を構築します。 1/2
日本として大規模言語モデルとどう関わっていくべきか。非常に大切な話ですね。
WandBの創設者と話せたしDL4J作った人とも話せたしで大満足の会でした (Stability.aiの方と話せなかったのが悔いが残る…) 運営の皆さまありがとうございました! #wandb_tokyo
OpenAIのシェインさん(@shanegJP)と落合先生(@ochyai)の動画見てたら、突如自分が作成した図(スクショ右)が出てきて嬉しくなった深夜 youtube.com/watch?v=QmgmEy…
United States Trends
- 1. Chiefs 125 B posts
- 2. Josh Allen 49,4 B posts
- 3. 49ers 39 B posts
- 4. Niners 7.679 posts
- 5. Mahomes 34,8 B posts
- 6. Geno 33,2 B posts
- 7. Super Bowl 1.261 posts
- 8. Bo Nix 15,4 B posts
- 9. #KCvsBUF 20,3 B posts
- 10. WWIII 96,9 B posts
- 11. Falcons 20 B posts
- 12. Seahawks 26,9 B posts
- 13. Broncos 33,6 B posts
- 14. Kyle 46 B posts
- 15. Chargers 17,2 B posts
- 16. Steelers 128 B posts
- 17. Paige 19,2 B posts
- 18. 72 Dolphins 1.159 posts
- 19. Ravens 87,5 B posts
- 20. Bears 118 B posts
Who to follow
-
Daisuke Okanohara / 岡野原 大輔
@hillbig -
小川雄太郎
@ogawa_yutaro_22 -
cvpaper.challenge | AI/CV研究コミュニティ
@CVpaperChalleng -
AI技術最新情報メディア | AI-SCHOLAR
@ai_scholar -
DLHacks
@DL_Hacks -
Koki Saitoh 斎藤康毅
@SaitohKoki -
goto
@goto_yuta_ -
ステート・オブ・AI ガイド
@stateofai_ja -
今井翔太 / Shota Imai@えるエル
@ImAI_Eruel -
Preferred Networks
@PreferredNetJP -
須山敦志 Suyama Atsushi
@sammy_suyama -
shinmura0
@shinmura0 -
akira
@AkiraTOSEI -
piqcy
@icoxfog417 -
mi141
@mi141
Something went wrong.
Something went wrong.