@sakanaai.bsky.social
📤 964
📥 0
📝 225
Sakana AI is an AI R&D company based in Tokyo, Japan. 🗼🧠
https://sakana.ai/careers
How Sakana AI’s new evolutionary algorithm builds powerful AI models without expensive retraining
venturebeat.com/ai/how-sakan...
loading . . .
How Sakana AI’s new evolutionary algorithm builds powerful AI models without expensive retraining
M2N2 is a model merging technique that creates powerful multi-skilled agents without the high cost and data needs of retraining.
https://venturebeat.com/ai/how-sakana-ais-new-evolutionary-algorithm-builds-powerful-ai-models-without-expensive-retraining/
25 days ago
0
8
2
We are honored that Sakana AI’s CEO David Ha (
@hardmaru.bsky.social
) has been named to the TIME 100 AI 2025 list. Full List:
time.com/time100ai
We’re truly grateful for the recognition and will continue our mission to build a frontier AI company in Japan. Thank you for your support!
26 days ago
0
12
1
What if we could evolve AI models like organisms, letting them compete, mate, and combine their strengths to produce ever-fitter offspring? Excited to share our new paper, “Competition and Attraction Improve Model Fusion” presented at GECCO 2025 (runner-up for best paper)!
arxiv.org/abs/2508.16204
about 1 month ago
2
36
17
Sakana AI が募集しているSoftware Engineerの募集要項(Job Description)をアップデートしました。
sakana.ai/careers/#sof...
Sakana AIにおけるSoftware Engineerは、Applied Teamの一員としてビジネスのインパクトにつながるプロダクト開発を行っています。Frontend、Backend、Infrastructure構築の全体にわたって、AI技術を組み込んだアプリケーションの設計・開発に挑戦いただける方のご応募をお待ちしております!
about 1 month ago
1
1
1
8/7に、Sakana AIは初となるApplied Research Engineer向けのOpen Houseを開催しました。現地で70名、オンラインで200名超の方にご参加いただいた本イベントのレポートを公開します。
sakana.ai/open-house-2...
イベントでは共同創業者2名も登壇し、研究開発とビジネスの両輪をどう回し、日本や世界の産業・コミュニティにどう貢献していくかを語りました。また、現場で活躍するAppliedチームのメンバーが、チームの特徴や働き方、AIエージェント開発の実態、Researchチームとの連携などについて紹介しました。
about 1 month ago
0
2
1
Coverage of Darwin Gödel Machine and The AI Scientist in MIT Technology Review article.
@technologyreview.com
www.technologyreview.com/2025/08/06/1...
loading . . .
Five ways that AI is learning to improve itself
From coding to hardware, LLMs are speeding up research progress in artificial intelligence. It could be the most important trend in AI today.
https://www.technologyreview.com/2025/08/06/1121193/five-ways-that-ai-is-learning-to-improve-itself/
about 2 months ago
0
5
2
【UI/UXデザイナー募集】 Sakana AIでは、当社AI技術の社会実装のフェーズに進むことに伴い、一人目のUI/UXデザイナーを募集します。 詳細:
sakana.ai/careers/#uiu...
お任せしたいのはプロダクトのコンセプト設計から、プロトタイプの作成、ユーザーテストまでの全てのプロセス。AIによる価値実現に向け、目下成長するApplied Teamの一員として、Sakana AIのプロダクトづくりに挑んでくださる、意欲ある方のご応募をお待ちしています!
about 2 months ago
0
0
1
Kenneth Stanley & Joel Lehmanによる名著『Why Greatness Cannot Be Planned』の日本語版がBNN社より刊行されました! 『目標という幻想:未知なる成果をもたらす、〈オープンエンド〉なアプローチ』 監修:岡瑞起、翻訳:牧尾晴喜、解説:岡瑞起・鈴木健 本書は、科学・技術・芸術・ビジネスなど 、あらゆる領域でブレークスルーを起こすための「目標を定めない」オープンエンドなアプローチを提唱しています。 『WIRED JAPAN』日本版にて、『目標という幻想』日本語版解説が全文公開されました。
wired.jp/article/why-...
loading . . .
偉大なことは計画できない──『目標という幻想』日本語版解説
現在のAI開発にも影響を与えた注目書『目標という幻想──未知なる成果をもたらす、〈オープンエンド〉なアプローチ』から、岡瑞起と鈴木健による解説をお届けする。
https://wired.jp/article/why-greatness-cannot-be-planned-book/
about 2 months ago
0
2
2
「Sakana AIは学術研究のイメージが強いけど、どうやってそれをビジネスにつなげるの?」最先端AIの社会実装に挑む「Applied Team」インタビュー!
sakana.ai/applied-team...
Sakana AIでは、世界トップレベルの生成AI技術を社会実装するために「Applied Team」を本格始動しています。 Applied Teamについて知っていただくことを目的として、AI研究の社会実装に挑む二人のメンバーのインタビュー記事を公開しました。 「事業専門性とR&Dの強みが社内に揃っているスタートアップの環境は、世界で見ても非常に珍しいのではないかと思います。」
about 2 months ago
1
2
1
【Sakana AIエンジニアの著書刊行🎉】 Sakana AIのApplied Research Engineer、太田真人が共著者を務める『現場で活用するための AIエージェント実践入門』(講談社)が刊行されました。進歩を続けるAIエージェント技術を実践に繋げるための知見が満載ですので、ぜひご覧ください! Amazon:
www.amazon.co.jp/dp/4065401402/
8/7開催のApplied Engineer Open Houseには太田も登壇します。ご参加お待ちしています! Event:
connpass.com/event/362760/
2 months ago
0
1
1
翻訳の良さを多元的に評価する:「TransEvalnia」公開 論文:
arxiv.org/abs/2507.12724
GitHub:
github.com/SakanaAI/Tra...
Sakana AIはリーズニングを用いて翻訳の多次元的な評価とランキングを行う、プロンプトベースの翻訳評価・ランキングシステム「TransEvalnia」を公開しました。 本システムは翻訳品質評価フレームワークであるMultidimensional Quality Metricの一部に基づいて詳細な評価を行い、どの翻訳が最適かの判断や、様々な評価軸ないし翻訳全体の良さに関する数値スコアを出力します。
2 months ago
1
5
0
TransEvalnia: Reasoning-based Evaluation and Ranking of Translations
arxiv.org/abs/2507.12724
By Richard Sproat, Tianyu Zhao, Llion Jones We are happy to release TransEvalnia, a prompting-based translation evaluation and ranking system that uses reasoning in performing its evaluations and ranking.
2 months ago
1
4
1
8月7日18時からSakana AI初のApplied Engineer Open Houseを開催します! Sakana AIのApplied Teamのメンバーが業務についてやSakana AIで働く魅力についてお話しします。会場参加(抽選)または、オンライン参加が可能です。
connpass.com/event/362760/
Connpassからの参加登録をお待ちしております!
2 months ago
0
3
1
reposted by
Techmeme
3 months ago
Tokyo-based Sakana AI details a new Monte Carlo tree search-based technique that lets multiple LLMs cooperate on a single task, outperforming individual models (Ben Dickson/VentureBeat)
Main Link
|
Techmeme Permalink
1
16
5
reposted by
Techmeme Chatter
3 months ago
This post appeared under
this Techmeme headline
:
add a skeleton here at some point
0
4
2
Sakana AI’s TreeQuest: Deploy multi-model teams that outperform individual LLMs (VentureBeat)
venturebeat.com/ai/sakana-ai...
loading . . .
Sakana AI’s TreeQuest: Deploy multi-model teams that outperform individual LLMs by 30%
Sakana AI's new inference-time scaling technique uses Monte-Carlo Tree Search to orchestrate multiple LLMs to collaborate on complex tasks.
https://venturebeat.com/ai/sakana-ais-treequest-deploy-multi-model-teams-that-outperform-individual-llms-by-30/
3 months ago
0
3
2
Sakana AIではApplied Teamの立ち上げを急速に進めており、優秀なApplied Research Engineerを引き続き募集しています🚀
sakana.ai/careers/#app...
正社員だけでなく学生インターンシップも歓迎です✨ 金融・保険などのエンタープライズ分野から政府・防衛などの公共分野での業務に興味のある方 最先端のAI技術を実社会に導入してインパクトを出したい方 雇用期間や勤務スタイルの相談もできますのでぜひご応募ください!
3 months ago
0
3
3
Wider or Deeper? Scaling LLM Inference-Time Compute with Adaptive Branching Tree Search
arxiv.org/abs/2503.04412
3 months ago
1
21
5
AIも「3人寄れば文殊の知恵」、Sakana AIが新しい推論手法を開発 3人集まれば1人よりも優れた知恵が出るということわざ「3人寄れば文殊の知恵」が、AIにも当てはまった格好だ。 🐡🐟🐠
xtech.nikkei.com/atcl/nxt/new...
loading . . .
AIも「3人寄れば文殊の知恵」、Sakana AIが新しい推論手法を開発
Sakana AIは2025年7月1日、複数の大規模言語モデル(LLM)が推論時に連携することで、単体のLLMでは解くのが困難な問題を解くアルゴリズム「Multi-LLM AB-MCTS(Adaptive Branching Monte Carlo Tree Search)」を開発したと発表した。
https://xtech.nikkei.com/atcl/nxt/news/24/02657/
3 months ago
0
4
2
AIにもっと“試行錯誤”と“集合知”を─Sakana AIが開発する新アルゴリズム
wired.jp/article/saka...
フロンティアモデルと呼ばれるAIを単体ではなく“混ぜて”使えば、個々のモデル─ChatGPT、Gemini、DeepSeek─を使うよりも大幅に上回る成績を出すことが可能だと、日本発AIスタートアップのSakana AIが発表した。
loading . . .
AIにもっと“試行錯誤”と“集合知”を──Sakana AIが開発する新アルゴリズム
フロンティアモデルと呼ばれるAIを単体ではなく“混ぜて”使えば、個々のモデル──ChatGPT、Gemini、DeepSeek──を使うよりも大幅に上回る成績を出すことが可能だと、日本発AIスタートアップのSakana AIが発表した。
https://wired.jp/article/sakana-ai-new-algorithm/
3 months ago
0
4
2
reposted by
Ino.Ichi
3 months ago
Just published a blog post on our new LLM answer search method: "Multi-LLM AB-MCTS”🚀 It's designed to flexibly explore how to search and which LLM to use for any given problem. We've also open-sourced the implementation and experiments. Check it out! 🙌
add a skeleton here at some point
0
4
2
フロンティアAIモデルを「混ぜて使う」── 「試行錯誤」と「集合知」で新たな推論時スケーリングへ ブログ:
sakana.ai/ab-mcts-jp/
論文:
arxiv.org/abs/2503.04412
このたびSakana AIは新アルゴリズム「AB-MCTS」を開発し、ARC-AGI-2ベンチマークで有望な結果を得ました。
3 months ago
1
2
3
reposted by
hardmaru
3 months ago
Inference-Time Scaling and Collective Intelligence for Frontier AI
sakana.ai/ab-mcts/
We developed AB-MCTS, a new inference-time scaling algorithm that enables multiple frontier AI models to cooperate, achieving promising initial results on the ARC-AGI-2 benchmark.
loading . . .
1
15
3
We’re excited to introduce AB-MCTS! Our new inference-time scaling algorithm enables collective intelligence for AI by allowing multiple frontier models (like Gemini 2.5 Pro, o4-mini, DeepSeek-R1-0528) to cooperate. Blog:
sakana.ai/ab-mcts
Paper:
arxiv.org/abs/2503.04412
3 months ago
1
15
6
When AI Is Designed Like A Biological Brain 🧠
youtu.be/dYHkj5UlJ_E
loading . . .
When AI Is Designed Like A Biological Brain
YouTube video by bycloud
https://youtu.be/dYHkj5UlJ_E
3 months ago
0
8
3
Introducing Reinforcement-Learned Teachers (RLTs): Transforming how we teach LLMs to reason with reinforcement learning (RL). Blog:
sakana.ai/rlt
Paper:
arxiv.org/abs/2506.08388
Code:
github.com/SakanaAI/RLT
We introduce a new way to teach LLMs how to reason by learning to teach, not solve.
loading . . .
3 months ago
2
33
8
Japanese AI start-up challenges titans with lean innovation
www3.nhk.or.jp/nhkworld/en/...
loading . . .
Japanese AI start-up challenges titans with lean innovation | NHK WORLD-JAPAN News
Tokyo-based Sakana AI just landed a major banking client. CEO David Ha explains why customized apps focused on energy efficiency could shape the future of generative AI.
https://www3.nhk.or.jp/nhkworld/en/news/videos/20250523204933890/
3 months ago
0
7
1
Sakana AI、「AIが深く思考する能力」のベンチマーク公開 エージェントも開発
xtech.nikkei.com/atcl/nxt/col...
loading . . .
Sakana AI、「AIが深く思考する能力」のベンチマーク公開 エージェントも開発
Sakana AIは2025年6月17日、競技プログラミングサービスを提供するAtCoderと共同で、AI(人工知能)が出力したプログラムが組み合わせ最適化問題を解く能力を測定するベンチマークテスト「ALE-Bench」を開発したと発表した。
https://xtech.nikkei.com/atcl/nxt/column/18/00001/10787/
3 months ago
1
3
1
「組合せ最適化問題」への挑戦 ALE-BenchおよびALE-Agentの開発 ブログ:
sakana.ai/ale-bench-jp/
論文:
arxiv.org/abs/2506.09050
AIの次の挑戦として、「組合せ最適化問題」のアルゴリズム生成に着目した新ベンチマーク「ALE-Bench」、および特化型エージェント「ALE-Agent」を開発しました。 正解/不正解を問うこれまでのAIベンチマークとは異なり、未知の最適解を探し続ける「組合せ最適化問題」では、長期的な推論能力や創造性が求められます。
3 months ago
1
3
1
Towards Automating Long-Horizon Algorithm Engineering for Hard Optimization Problems Blog:
sakana.ai/ale-bench/
Paper:
arxiv.org/abs/2506.09050
ALE-Bench is a coding benchmark focused on NP-hard optimization problems. ALE-Agent, created using ALE-Bench, ranked 21/1000 on AtCoder Heuristic Contest!
loading . . .
3 months ago
2
10
7
Sakana AI and MUFG sign agreement to automate creation of banking documents
www.japantimes.co.jp/business/202...
Sakana AI has signed a ¥5 billion ($34M) deal with Mitsubishi UFJ Financial Group (MUFG) to automate the creation of banking documents, including credit approval memos.
loading . . .
Sakana AI and MUFG sign agreement to automate creation of banking documents
The AI Scientist, which was originally designed for automating scientific discovery, including manuscript writing and peer review, will be used.
https://www.japantimes.co.jp/business/2025/05/19/companies/mufg-sakana-ai-credit-approval-documents/
3 months ago
1
2
1
北國FHD、世界的AI企業と協業 地銀初、サービス充実へ合意書 杖村氏「増員と同じ」 北國銀行を傘下に持つ北國フィナンシャルホールディングス(FHD、金沢市)が、世界的に注目される日本発の生成人工知能(AI)のベンチャー企業と地銀初の協業に乗り出す。銀行業務の効率化のほか、事業承継や企業の合併・買収(M&A)の仲介などサービスの充実にAIの活用を検討する。最先端技術で地域の社会課題の解決を推し進める地域金融機関のモデルケースを目指す。
news.yahoo.co.jp/articles/de8...
loading . . .
北國FHD、世界的AI企業と協業 地銀初、サービス充実へ合意書 杖村氏「増員と同じ」(北國新聞社) - Yahoo!ニュース
●業務効率化、事業承継、M&A仲介… 北國銀行を傘下に持つ北國フィナンシャルホールディングス(FHD、金沢市)が、世界的に注目される日本発の生成人工知能(AI)のベンチャー企業と地銀初の協業に
https://news.yahoo.co.jp/articles/de8b194d83d03d8aa2b790b488345ca28f453eb5
3 months ago
0
2
0
We’re excited to introduce Text-to-LoRA: a Hypernetwork that generates task-specific LLM adapters (LoRAs) based on a text description of the task. Catch our presentation at
#ICML2025
! Paper:
arxiv.org/abs/2506.06105
Code:
github.com/SakanaAI/Tex...
loading . . .
3 months ago
1
51
12
Our paper, “EDINET-Bench: Evaluating LLMs on Complex Financial Tasks using Japanese Financial Statements” is now on arXiv:
arxiv.org/abs/2506.08762
We hope this release will challenge researchers to benchmark new advances in LLMs and agents on challenging financial tasks in Japan.
loading . . .
EDINET-Bench: Evaluating LLMs on Complex Financial Tasks using Japanese Financial Statements
Financial analysis presents complex challenges that could leverage large language model (LLM) capabilities. However, the scarcity of challenging financial datasets, particularly for Japanese financial...
https://arxiv.org/abs/2506.08762
3 months ago
0
1
1
reposted by
hardmaru
4 months ago
Working with Hokkoku Bank, Sakana AI aims to help transform the regional banking industry in Japan, to serve as a model case for other regional banks in the future.
0
1
1
reposted by
hardmaru
4 months ago
Our team traveled to Ishikawa Prefecture in Japan today, where we had the honor meeting with Shuji Tsuemura, the President of Hokkoku Bank, to announce our partnership deal with the Bank where Sakana AI will provide bank-specific AI solutions to the regional bank.
add a skeleton here at some point
1
10
1
北國銀行と戦略提携 - MOU締結
sakana.ai/hokkokubank/
この度、株式会社北國フィナンシャルホールディングス様との間で、地域金融×AIの推進に向けた戦略連携に関する基本合意書(MOU)を締結しました。 先月発表した三菱UFJ銀行様との包括的パートナーシップに続き、本合意は、メガバンクに加えて地域金融機関とも連携を加速させるものです。地方銀行の中でも、AIを活用した先端的な取り組みにいち早く取り組まれてきた北國FHD様と共に、AIによる価値共創に向けて協業できることを大変光栄に思います。
4 months ago
1
1
2
reposted by
hardmaru
4 months ago
Darwin Gödel Machine: A Commentary on Novelty and Implications.
antomon.github.io/posts/darwin...
loading . . .
Darwin Gödel Machine: A Commentary on Novelty and Implications – Random Bits of Knowledge
Autonomous, self-improving artificial intelligence has long been a theoretical aspiration, yet practical implementations have remained elusive because formal proof–based self-modification is computati...
https://antomon.github.io/posts/darwin-godel-machine/
0
10
2
Sakana AIではApplied Teamの立ち上げを急速に進めており、優秀なApplied Research Engineerを引き続き募集しています🚀 募集要項:
sakana.ai/careers/#app...
正社員だけでなく学生インターンシップも歓迎です✨ 金融・保険などのエンタープライズ分野から政府・防衛などの公共分野での業務に興味のある方 最先端のAI技術を実社会に導入してインパクトを出したい方 雇用期間や勤務スタイルの相談もできますのでぜひご応募ください!
4 months ago
0
2
1
reposted by
hardmaru
4 months ago
It turns out that Logistic Regression is still a very strong baseline for detecting fraudulent Japanese financial statements, matching frontier models like Claude3.7, R1, o4-mini. Much more room for future improvement! GitHub:
github.com/SakanaAI/EDI...
HuggingFace:
huggingface.co/datasets/Sak...
0
13
5
reposted by
hardmaru
4 months ago
EDINET-Bench: Evaluating LLMs on Complex Financial Tasks using Japanese Financial Statements Paper:
pub.sakana.ai/edinet-bench/
We just released a Japanese financial benchmark designed to evaluate the performance of AI Agents on challenging financial tasks like accounting fraud detection.
add a skeleton here at some point
1
9
2
日本語金融ベンチマーク「EDINET-Bench」を公開 ブログ:
sakana.ai/edinet-bench/
論文:
pub.sakana.ai/edinet-bench/
金融庁の電子開示システムであるEDINETの有価証券報告書を活用し、高度な金融タスクにてAIがどの程度対応できるかを測るための日本語金融ベンチマークを構築しました。 EDINET-Bench での評価の結果、現状のLLMを単純に適用するだけでは、会計不正検知等において実用的な性能は出ないという課題が確認された一方、入力情報を工夫することによる性能向上の可能性も示唆されました。
4 months ago
1
4
3
The authors also recommend Matthew Berman’s video for a nice introduction and walk through of the Darwin Gödel Machine paper. Video:
youtu.be/cMbGmdy2sfM
4 months ago
1
9
1
We believe that evolutionary open-ended search and self-improving AI systems will be key to unlocking stronger AI capabilities. For a short overview, this video from Wes Roth discusses AlphaEvolve and our recent Darwin Gödel Machine: Video
youtu.be/1XXxG6PqzOY
Short
www.youtube.com/shorts/7SCHT...
loading . . .
4 months ago
0
9
1
reposted by
hardmaru
4 months ago
I like the comparison chart between AlphaEvolve and the Darwin Gödel Machine, and the analogy of the two approaches with two different kinds of chefs 🍽️
0
4
1
reposted by
hardmaru
4 months ago
AI that can improve itself: A deep dive into self-improving AI and the Darwin-Gödel Machine.
richardcsuwandi.github.io/blog/2025/dgm/
Excellent blog post by Richard Suwandi reviewing the Darwin Gödel Machine (DGM) and future implications.
1
16
3
Darwin Godel Machine: Open-Ended Evolution of Self-Improving Agents
arxiv.org/abs/2505.22954
loading . . .
Darwin Godel Machine: Open-Ended Evolution of Self-Improving Agents
Today's AI systems have human-designed, fixed architectures and cannot autonomously and continuously improve themselves. The advance of AI could itself be automated. If done safely, that would acceler...
https://arxiv.org/abs/2505.22954
4 months ago
0
15
3
reposted by
Jeff Clune
4 months ago
Excited to introduce the Darwin Gödel Machine: Open-Ended Evolution of Self-Improving Agents. We harness the power of open-ended algorithms to search for agentic systems that get better at coding, including improving their own code.
add a skeleton here at some point
0
30
7
自己改善するAIを現実に:ダーウィン・ゲーデルマシン(DGM)の提案 ブログ:
sakana.ai/dgm-jp
論文:
arxiv.org/abs/2505.22954
人間のように学び続け、どこまでも自己改善するAIは作れるか──これはAI研究の長年のゴールでした。 20数年前、ユルゲン・シュミットフーバー教授が提案した 「ゲーデルマシン」は、まさに自己改善するAIの可能性を示す重要な研究として知られています。
4 months ago
1
3
2
Introducing The Darwin Gödel Machine
sakana.ai/dgm
The Darwin Gödel Machine is a self-improving agent that can modify its own code. Inspired by evolution, we maintain an expanding lineage of agent variants, allowing for open-ended exploration of the vast design space of such self-improving agents.
4 months ago
1
37
12
Load more
feeds!
log in