Episodios

  • #12【Vision AI】CNNからViT・Diffusion・GPT-4oのマルチモーダルLLMまで。生成系AIの系譜を徹底解説
    Jul 11 2025

    ImageNetを席巻し深層学習の夜明けを告げたAlexNet (2012)、そこからPatch+Attentionで視覚にTransformerを持ち込んだViT、テキスト×画像を結び付けたCLIPへ──そしてGAN、VAE、Diffusionが拓いた画像生成の最前線へ。最後はOmni-Transformer 4oに代表されるマルチモーダルLLMまで一気通貫で解説します。


    (00:00:00) イントロ — 画像AIの現在地

    (00:02:12) CNN

    (00:04:24) ViT:Patch+Attentionで視覚をTransformer化

    (00:09:55) CLIP:Dual Encoderが拓くマルチモーダル表現

    (00:18:27) GAN

    (00:26:18) VAE・の生成モデル総覧

    (00:33:38) Diffusion

    (00:37:08) Omni-Transformer 4o

    (00:47:08) スケール則でマルチモーダル問題は解決するか


    SingularRadio(シンギュラーラジオ) は、テクノロジー、イノベーション、社会の未来について、深い知識と洞察を提供するポッドキャストです。

    海外大(ブリティッシュコロンビア大学)でコンピュータサイエンスを専攻するKeisukeとTakeshiのホスト二人が、AI、ロボティクス、スタートアップ、経済などの最前線で起きている出来事を掘り下げ、知的好奇心を刺激する内容をお届けします。



    ▼運営会社(株式会社日本自動化技術)はこちら

    https://japan-automation-technology.vercel.app

    お仕事の御依頼は上記HPのお問い合わせフォームまたはsingularradio01@gmail.comまでご連絡ください。


    Apple Podcast: https://podcasts.apple.com/us/podcast/id1809437976

    Spotify: ⁠https://open.spotify.com/show/2nOYrpc9PhKQ5v7s81KzCW

    X (Twitter) アカウント:⁠https://x.com/SingularRadio⁠


    #CNN #LeNet #AlexNet #ResNet #ViT #CLIP #GAN #Diffusion #生成AI #GPT4o #OmniTransformer #Stargate #AI解説 #深層学習 #multimodal

    Más Menos
    57 m
  • #11 【Sakana AI】“教えるAI”から“自己進化マシン”まで! 日本発ユニコーンSakana AIの挑戦を追う
    Jul 6 2025

    日本最速ユニコーンとして一躍話題となった日本初AIスタートアップSakana AI の成り立ちと現在地を徹底解説。最新研究から読み解くSakana AIが描く未来とは?(00:00:00) オープニング - Sakana AIとはどういう組織?(00:05:53) 「教えるAI」が知識を伝播する:Reinforcement Learning Teachers (RLT)(00:14:30) 進化的モデルマージ:EvoMerge & EvoLLMシリーズ(00:17:40) 効率化と自己適応:Transformer²(00:22:10) AIが自ら科学研究を行う:AI Scientist v2(00:26:40) 自己改良し続けるAI:Darwin Gödel Machine (DGM)(00:32:42) 時間を持つネットワーク:Continuous Thought Machine (CTM)(00:38:31) 社会実装と産業インパクトingularRadio(シンギュラーラジオ) は、テクノロジー、イノベーション、社会の未来について、深い知識と洞察を提供するポッドキャストです。海外大(ブリティッシュコロンビア大学)でコンピュータサイエンスを専攻するKeisukeとTakeshiのホスト二人が、AI、ロボティクス、スタートアップ、経済などの最前線で起きている出来事を掘り下げ、知的好奇心を刺激する内容をお届けします。▼運営会社(株式会社日本自動化技術)はこちら https://japan-automation-technology.vercel.appお仕事の御依頼は上記HPのお問い合わせフォームまたはsingularradio01@gmail.comまでご連絡ください。Apple Podcast: https://podcasts.apple.com/us/podcast/id1809437976Spotify: ⁠https://open.spotify.com/show/2nOYrpc9PhKQ5v7s81KzCWX (Twitter) アカウント:⁠https://x.com/SingularRadio⁠#SakanaAI #群知能 #生成AI #日本発スタートアップ #AI研究 #EvoLLM #AIエージェント #ICLR2025 #CTM #TinySwallow #DarwinGodelMachine #RLT #AIサイエンティスト #進化的AI #EdgeAI #金融AI #モデル蒸留 #オープンソースAI #AI民主化 #TokyoTech #DeepLearning #マルチモーダルAI #SelfImprovingAI #AI未来 #SingularRadio #CycleQD #Transformer2 #EvoMerge #TAID

    Más Menos
    43 m
  • #10 【OpenAI】ChatGPTを開発した企業の理念と歴史 - ガバナンスとイノベーションは両立できるか
    Jun 25 2025

    ChatGPTをきっかけに生成AIブームを引き起こしたOpenAI。その組織構造・資金戦略・技術ロードマップを、創業から最新プロジェクト「Stargate」「io」まで網羅的に解説します。ガバナンスとイノベーションは両立できるのか ー 国家戦略級へと拡大するAI産業の行方を、一次情報と時系列で整理し、論理的かつ実務的に読み解きます。(00:00:00) オープニング - 一大産業となったAI研究領域(00:02:38) 変わりゆく組織形態 - 非営利から営利へ(2015–2025)(00:05:14) 創業ストーリー:Elon MuskとLarry Pageの対立(00:09:31) 初期プロジェクト:OpenAI Gym, Dactyl, OpenAI Five(00:11:04) GPTシリーズ誕生と「営利子会社」設立の舞台裏(00:19:04) ChatGPT爆発的普及とCEO解任劇の真相(00:26:37) Stargate計画:400,000 GPUと原子力によるAI版マンハッタン計画(00:33:31) 新デバイス“io”とその機能を予想(00:39:42) WorldcoinとProof-of-PersonhoodSingularRadio(シンギュラーラジオ) は、テクノロジー、イノベーション、社会の未来について、深い知識と洞察を提供するポッドキャストです。海外大(ブリティッシュコロンビア大学)でコンピュータサイエンスを専攻するKeisukeとTakeshiのホスト二人が、AI、ロボティクス、スタートアップ、経済などの最前線で起きている出来事を掘り下げ、知的好奇心を刺激する内容をお届けします。▼運営会社(株式会社日本自動化技術)はこちら https://japan-automation-technology.vercel.appお仕事の御依頼は上記HPのお問い合わせフォームまたはsingularradio01@gmail.comまでご連絡ください。Apple Podcast: https://podcasts.apple.com/us/podcast/id1809437976Spotify: ⁠https://open.spotify.com/show/2nOYrpc9PhKQ5v7s81KzCWX (Twitter) アカウント:⁠https://x.com/SingularRadio⁠#OpenAI #オープンAI #生成AI #AGI #SamAltman #elonmusk #イーロンマスク #Stargate #GPT5 #Worldcoin #singularradio

    Más Menos
    45 m
  • #9【Vibe Coding】バイブコーディングの限界?エンジニアの未来を読む
    Jun 22 2025

    バイブコーディングの幻想と現実、そして AI で何でもできる時代になぜまだ知識量が必要なのかを深掘ります。AI と協働する開発の本質と、これから数年間 エンジニアと非エンジニアを分ける差分が明確になります。(00:00:00) バイブコーディングとは?(00:02:36) AI開発におけるエンジニアと非エンジニアの差はどこにある?(00:07:26) 欲求を持つために知識が必用?(00:15:53) この時代にcomputer scienceを学ぶ意義(00:20:53) 現代のエンジニアはどうやって開発している?(00:22:10) AI開発の未来はどうなる?恒久的な課題は?(00:30:00) AIが欲求を持つ社会は実現するのか?(00:37:45) エンジニアの未来とAI時代の開発体制のすすめ(00:43:38) 今から開発を学ぶならどうすればいい?SingularRadio(シンギュラーラジオ) は、テクノロジー、イノベーション、社会の未来について、深い知識と洞察を提供するポッドキャストです。海外大(ブリティッシュコロンビア大学)でコンピュータサイエンスを専攻するKeisukeとTakeshiのホスト二人が、AI、ロボティクス、スタートアップ、経済などの最前線で起きている出来事を掘り下げ、知的好奇心を刺激する内容をお届けします。▼運営会社(株式会社日本自動化技術)はこちら https://japan-automation-technology.vercel.appお仕事の御依頼は上記HPのお問い合わせフォームまたはsingularradio01@gmail.comまでご連絡ください。Apple Podcast: https://podcasts.apple.com/us/podcast/id1809437976Spotify: ⁠https://open.spotify.com/show/2nOYrpc9PhKQ5v7s81KzCWX (Twitter) アカウント:⁠https://x.com/SingularRadio⁠#バイブコーディング #VibeCoding #AI開発 #エンジニアの未来#SingularRadio #AI時代の学び #AIと人間協働 #プログラミング勉強法 #AITools #エンジニアリング

    Más Menos
    52 m
  • #8【AlphaGo】人間の限界を超えた強化学習AI - Move 37からAlphaFold創薬まで
    Jun 11 2025

    AlphaGo は「創造性の最後の砦」と呼ばれた囲碁で人類を打ち破り、私たちの“能力と価値”の座標を根底から揺さぶりました。本エピソードでは、李世乭五番勝負の舞台裏、Move 37/Move 78 の衝撃、そして AlphaGo Zero・AlphaZero・AlphaFold に連なる進歩の歴史を総ざらい。LLM 時代にコードで AI に負け始めた私たちは、どこに希望を見いだせるのか?


    (00:00:00) なぜ今また AlphaGo を語るのか?— LLM に負ける日常と人間の価値再定義

    (00:04:18) DeepMind 創設物語 — デミス・ハサビスと Google 買収

    (00:05:44) 2015 欧州王者ファン・フイ戦

    (00:07:59) 2016 李世乭五番勝負

    (00:11:35) AlphaGoがもたらした国際反響—中国AI国家戦略

    (00:14:34) AlphaGo, AlphaZero の仕組みとその特徴

    (00:24:55) ロボットと強化学習

    (00:28:06) AlphaFold が創薬を変えた—マラリア薬・がん抗原の実例

    (00:30:53) AGI とは何を指す?(囲碁AI, チューリングテスト)

    (00:35:01) 超知能的な世界で人はどう生きるべきか

    エピソード内で言及されたボードゲーム四ノ国について

    - この動画で紹介されています:https://youtu.be/CZiFt65oezE

    - 関連リンク:https://yonokuni.net

    SingularRadio(シンギュラーラジオ) は、テクノロジー、イノベーション、社会の未来について、深い知識と洞察を提供するポッドキャストです。海外大(ブリティッシュコロンビア大学)でコンピュータサイエンスを専攻するKeisukeとTakeshiのホスト二人が、AI、ロボティクス、スタートアップ、経済などの最前線で起きている出来事を掘り下げ、知的好奇心を刺激する内容をお届けします。


    ▼運営会社(株式会社日本自動化技術)はこちら https://japan-automation-technology.vercel.app

    お仕事の御依頼は上記HPのお問い合わせフォームまたはsingularradio01@gmail.comまでご連絡ください。

    Apple Podcast: https://podcasts.apple.com/us/podcast/id1809437976

    Spotify: ⁠https://open.spotify.com/show/2nOYrpc9PhKQ5v7s81KzCW

    X (Twitter) アカウント:⁠https://x.com/SingularRadio⁠

    #AlphaGo #Move37 #人工知能 #DeepMind #李世乭 #AlphaZero #AlphaFold #agi #AI #AI時代 #囲碁AI #SingularRadio #強化学習

    Más Menos
    39 m
  • #7【Anthropic】Claude4を生んだAnthropicとは何者か?Anthropic社の挑戦とCEOの警告
    Jun 5 2025

    Anthropic という異色スタートアップと最新モデル Claude 4 の全貌を語ります。安全志向が生んだ“憲法AI”の仕掛け、ASL-3の緊張感、そして雇用への警鐘まで

    TIMESTAMPS:

    (00:00:00) Anthropicの起源と使命

    (00:00:24) HHHと憲法AI — 安全設計の核心

    (00:01:11) Claudeの進化史 — v1からOpus 4まで

    (00:03:42) Claude 4の能力と課題 — ASL-3で運用される理由

    (00:04:46) CEOダリオ・アモデイの警告 — 近未来への視点


    SingularRadio(シンギュラーラジオ) は、テクノロジー、イノベーション、社会の未来について、深い知識と洞察を提供するポッドキャストです。海外大(ブリティッシュコロンビア大学)でコンピュータサイエンスを専攻するKeisukeとTakeshiのホスト二人が、AI、ロボティクス、スタートアップ、経済などの最前線で起きている出来事を掘り下げ、知的好奇心を刺激する内容をお届けします。


    ▼運営会社(株式会社日本自動化技術)はこちら https://japan-automation-technology.vercel.appお仕事の御依頼は上記HPのお問い合わせフォームまたはsingularradio01@gmail.comまでご連絡ください。Apple Podcast: https://podcasts.apple.com/us/podcast/id1809437976Spotify: ⁠https://open.spotify.com/show/2nOYrpc9PhKQ5v7s81KzCWX (Twitter) アカウント:⁠https://x.com/SingularRadio⁠#claude4 #anthropic #ai解説 #ai開発 #人工知能 #ダリオアモデイ#ai #aiの安全性 #憲法AI (Constitutional AI) #openai #サムアルトマン #AIの未来#技術解説 #AIと仕事 #AIの進化 #最先端技術

    Más Menos
    41 m
  • #6【LLM】今こそLLM(大規模言語モデル)を理解するべき!! - その技術の核心と未来を探る
    May 26 2025

    SingularRadio(シンギュラーラジオ) は、テクノロジー、イノベーション、社会の未来について、深い知識と洞察を提供するポッドキャストです。海外大(ブリティッシュコロンビア大学)でコンピュータサイエンスを専攻するKeisukeとTakeshiのホスト二人が、AI、ロボティクス、スタートアップ、経済などの最前線で起きている出来事を掘り下げ、知的好奇心を刺激する内容をお届けします。

    第6回は、「Large Language Model(LLM)」のすべてを総まとめ。GPT、Gemini、Claude、Llamaなど多様化するLLMの歴史、選定軸、活用法、そして進化の最前線を解説。今求められるのは、各モデルの“個性”や背景を理解し、用途や目的に応じて最適なAIを“使いこなす”力。AIの選び方に迷う人も、最先端のトレンドを押さえたい人も必聴です。

    TIMESTAMPS:

    (00:02:55) LLM(大規模言語モデル)とは?

    (00:04:57) 言語モデルの歴史

    (00:12:35) モデル別の特徴と選び方

    (00:37:18) 今後の技術進化の方向性

    (00:42:30) AGIへの道


    ▼運営会社(株式会社日本自動化技術)はこちら https://japan-automation-technology.vercel.app

    お仕事の御依頼は上記HPのお問い合わせフォームまたはsingularradio01@gmail.comまでご連絡ください。


    Apple Podcast: https://podcasts.apple.com/us/podcast/id1809437976

    Spotify: ⁠https://open.spotify.com/show/2nOYrpc9PhKQ5v7s81KzCW

    X (Twitter) アカウント:⁠https://x.com/SingularRadio

    ⁠#LLM #生成AI #AGI #ai開発 #ChatGPT #GPT4o #Claude #GeminiAI #PromptEngineering#AIエージェント #Transformer #SingularRadio #ai #podcast

    Más Menos
    49 m
  • #5【Microsoft Build & Google I/O】巨大IT企業が掲げる2025年AI戦略とは?
    May 22 2025
    SingularRadio(シンギュラーラジオ) は、テクノロジー、イノベーション、社会の未来について、深い知識と洞察を提供するポッドキャストです。海外大(ブリティッシュコロンビア大学)でコンピュータサイエンスを専攻するKeisukeとTakeshiのホスト二人が、AI、ロボティクス、スタートアップ、経済などの最前線で起きている出来事を掘り下げ、知的好奇心を刺激する内容をお届けします。第5回は、2025年5月に開催された Microsoft Build と Google I/O の発表内容を総まとめ。GitHub Copilotの進化からNL Webの登場、Geminiのマルチモーダル能力やリアルタイム翻訳、そしてDiffusionベースの言語生成モデルまで、最新AIトレンドをカジュアルかつ網羅的に解説します。大企業の戦略とその裏側、OSとAIの連携がもたらす未来像についても深掘り。TIMESTAMPS:(00:00:00) オープニング・今回のテーマ紹介(00:00:24) Microsoft Build 2025 概要・開発者向け発表(エージェント・MCP・NL Web)(00:01:11) GitHub Copilotの進化:Pull Request自動生成とエージェント割り当て(00:03:42) Windows AI Foundry:AIがWord/PowerPointまで完全生成(00:04:46) OS (オペレーティングシステム)を持つ会社(Microsoft, Google)の強みとは(00:09:05) Copilot Tuning:社内用語や文脈への適応が簡単に(00:11:38) NL Web:AIフレンドリーなWeb設計、将来の標準に?(00:17:38) Google I/O 2025の概要と第一印象(AIカウントダウン映像など)(00:18:50) Gemini 2.5 Proの進化:トークン処理数50倍、マルチモーダル性能向上(00:19:28) AGI?Geminiがポケモン全バッジを取得した衝撃(00:24:07) Google Beam:1カメラでも3D化、Zoom以上の体験へ(00:26:48) Google Meetのリアルタイム翻訳:英-西の同時通訳デモ(00:29:46) Project Astra:カメラ越しに「これ何?」と聞けるAI(00:31:22) AIと教育の可能性(00:36:35) Gmailなどを活用したパーソナライズ機能(00:39:46) Diffusion vs Transformer:言語生成モデルの新潮流【主要キーワード解説リスト】- OS (オペレーティングシステム)アプリやハードウェアを管理する基盤ソフト。例:Windows、macOS、Androidなど。AIとの統合が進むと操作の幅が広がる。- ファインチューニング既存のAIモデルを特定の用途に合わせて再学習させる方法。専門的な調整。- Copilot(コーパイロット)GitHub製のAI開発アシスタント。コード補完やバグ修正を支援。- Copilot TuningCopilotを社内向けに特化させるための簡易チューニング手法。- NL Web(Natural Language Web)自然言語で操作できるように設計された新世代Web。HTMLの次を目指す概念。- MCP(Model Context Protocol)AI(エージェント)が外部ツールと連携するための共通ルール・通信規格。- DiffusionモデルAIによる生成方式の一種。ランダムなデータから徐々に整った出力を生成。画像生成で有名。- Transformer現在の主流の言語AIモデル構造。単語ごとに次を予測して文章を生成。- AGI(汎用人工知能)人間のように幅広い課題に対応できるAI。- API(Artificial Pokémon Intelligence)AGIのジョーク的応用。AIがポケモンを攻略する能力から派生。- Google Beam1台のカメラ映像から立体的な映像を生成するAI技術。- Project Astra現実の映像をAIが理解し、リアルタイムで問いに答えるプロジェクト。- マルチモーダルテキスト・画像・音声など、複数のデータ形式を同時に処理できるAIの性質。- AzureMicrosoftのクラウドプラットフォーム。AIやアプリ開発に使われる。▼運営会社(株式会社日本自動化技術)はこちら https://japan-automation-technology.vercel.appお仕事の御依頼は上記HPのお問い合わせフォームまたはsingularradio01@gmail.comまでご連絡ください。Apple Podcast: https://podcasts.apple.com/us/podcast/id1809437976Spotify: ⁠https://open.spotify.com/show/2nOYrpc9PhKQ5v7s81KzCWX (Twitter) アカウント:⁠https://x.com/SingularRadio⁠#生成AI #AIニュース #テクノロジーの未来 #マイクロソフトBuild #GoogleIO2025 #シンギュラーラジオ #GeminiAI #Copilot #リアルタイム翻訳 #マルチモーダルAI #NLWeb #DiffusionModel #GitHubCopilot
    Más Menos
    44 m