orangeitems AI News

気になるAI Newsと考察を書いておきます。

Googleエージェントスペースは企業に革命を起こせるか

cloud.google.com

Google CloudのAgentSpaceは、企業向けにAIエージェントを構築、導入、共同開発するためのプラットフォームです。業務の自動化、顧客体験の向上、運用効率の最適化を目的としています。以下に主な特徴を挙げます:

 

主な特徴

①カスタマイズ可能なAIエージェント開発
企業やパートナーが業界や用途に応じて、特化したAIエージェントを構築するためのツールやリソースを提供します。

②エンタープライズシステムとの統合
企業のデータやシステムと連携し、情報の分析やプロセスの最適化をサポートします。

③マーケットプレイスでの公開
開発されたAIエージェントはGoogle Cloud Marketplaceで公開でき、他の企業が利用したり、収益化することが可能です。

☆幅広い活用事例
カスタマーサポート向けのバーチャルアシスタント
医療サービスの検索支援
業務効率化(例:データ分析、会話の要約)

ご覧の通り、ChatGPTにはできずらい、カスタムモデルの構築が容易にできるような建てつけになっている。1つの共有モデルが会社の情報資産を読み込み、複数の社員向け、もしくは顧客向けに情報支援ができることを期待できる内容となっている。

ChatGPTのGPTs(カスタムGPT)と似たような機能にも見えるけど、GPTsは事前に読み込ませた資料でファインチューニングして公開するだけの存在で、その後、動的に学習させるのはできないとは言わないが難しい仕掛けだった。

以下から早期アクセスが開始している。

cloud.google.com

さあ、どれくらい簡単に目的が達成できるのか。書いている事だけ読むと、コネクタを定義してデータソースにアクセスできるようにすれば勝手に学習するような感じに思える。もちろん、ローカルのデータではなく、クラウドのデータへではあるが。

この手の件、アクセス権が難しいところであり、機微なデータまで含めると大変なことになるので、実施は慎重に行わなければいけない。だからこそChatGPTはここまで踏み込んでいない気がする。

さて、Gemini 2.0の評判もいいので、このGoogleエージェントスペースがうまく動くなら、結構企業は便利に使い出すと思われる。

ChatGPT Canvasはいいアイデア、ちょっとまだ不便はあるけれど

www.watch.impress.co.jp

OpenAIは10日(米国時間)、「ChatGPT」で回答やコードを表示しながら、修正・改善できる機能「Canvas」を全ユーザーに開放した。これにより、全てのChatGPTユーザーがCanvasを使った文章作成やコーディングが可能になる。

Canvasは、左側のチャットエリアでChatGPTに指示を出して、右側のパネルでその修正を確認しながら作業を進められる機能。モデルはGPT-4oを利用する。これまでは、有料のChatGPT Plus(月額20ドル)とTeamユーザー向けにβ版を提供していたが、全ユーザーが利用可能になった。

 

確かにChatGPTでコーディングをお願いすること、毎日のようになっていたけど、チャットでコードが流れて行って結構不便だった。

新機能とは言うけど、GUIを整理しただけ。とは言え使いやすいので、プログラミングする人はぜひ使って見て。

ただ、言語によってはコードを表示するときに、改行しなかったりすることもあったので、まだ進化途中だとは思うけどすぐ修正されると思う。

 

こんな感じで、おいおい改行やタブはどこに行ったのかい?って感じ。

bashだとうまくいくんだけどな。

Canvasは仕事でも使っていくつもり。

画像生成はどこかで止まっている

ascii.jp

 画像生成AI「Stable Diffusion XL(SDXL)」のファインチューニングモデル、「NoobAI-XL(ヌーブエーアイ)」の登場が、画像生成AI関連の人たちをざわつかせています。イラスト風画像の生成性能が高いためです。ハイエンドモデルの「Stable Diffusion 3.5」や「Flux.1」への移行が始まろうとするなか、昨年8月にリリースされた旧モデルのSDXLに性能向上の余地がまだまだあることが明らかになってきたのです。

 

私もズブズブにStable Diffusionを触っていた時期があった。夜中の2:30まで起きてやってて、ああこのままじゃ日常生活が・・となっていた。

SDXLが出たまではスルスルと進化したが、1.5からSDXLに移ったときに、かなりのユーザーをスペック不足に追いやったこと。そして1.5で使えていたツールが利用不能になったり、その後著作権の問題等々もあって、進化が止まってしまったところで、私は利用を止めていた。

この世界、まだ続きがあったようで、SDXLはもう旧モデル扱いになり、3.5やらFlux.1やらがあるらしいが、今のところ戻る気はない。というか、ChatGPTやGrokのように、クラウド側で生成するのが本命っぽくなってきたからだ。

まぁ、ローカルで生成するのはとても精神の健康にはいいんだけど、ここからの進化もローカルのGPUを増強しなきゃいけないとすると、お金がかかるよね。

それこそ、画像生成の決定版、みたいな話が出てこない限りは、様子見だと思う。セットアップも大変で、使いづらいし。

とかなんとかいう話も、すぐに新しい技術でひっくり返されたりするので、何か新しい情報が出たらまた取り上げる。

Gemini 2.0はかなり使える

www.itmedia.co.jp

 米Googleは12月11日(現地時間)、次世代AIモデル「Gemini 2.0」と、それに関連する多数の取り組みを発表した。Gemini 2.0は、画像や音声の出力、ツールのネイティブ使用など、多くの新機能を備えている。

 

Gemini 2.0 Advancedは以下から既に使える。

gemini.google.com

 

Googleの検索ページからGeminiに誘導すればいいだろうに、何かアクセスしにくい感じ。よりによって、Google検索と競合している感じがして、Google自身もまだ結論を出せていない感じはする。

さて、このGemini 2.0 Advancedだが、無料でも使える。よくある、一定時間会話していると時間切れになるやつだが、ChatGPTのGPT-4oと比べると、結構まったり話ができるような気がする。

Geminiはアホだ、って思ってたけど、この2.0で完全に巻き戻して来た。一度ガッカリしたことがある人はまた試してみて欲しい。結構な精度で答えを返してくる。

しかし、Gemini 1.5と2.0でこれだけ性能が違うのがまるわかりだと、次のターンでどれくらい進化してくるか楽しみだ。きっと、他の陣営も相当危機感を持っているだろう。

選択肢がいっぱいあるのはうれしい。

・Gemini

・ChatGPT

・Claude

・Grok

とあるけど、私の感覚だと、ChatGPT > Gemini > Claude > Grokかな・・。

でも、Geminiが2.0の登場で面白くなってきた感じ。

この図式もまた時間の推移で変わるかもね。

 

これから、AI関連のニュースを集めます

今からはAIの時代がやってくると思うので、AI関連のニュースを集めてみたいと思います。不定期投稿です。orangeitemsが、世の中的に重要だと思うことを集めていきます。

とは言え、AIにブログを書かせようとかそういうことはしません。自分の勉強のために運営したいと思います。

いつまで続けるか不定ですが、よろしくお願いします。