声だけでパソコンを遠隔で操る端末

2024.03.24

話しかけるだけで…パソコンを遠隔操作できる小さな端末…。

AIが学習を重ねて…メッセージを送ったり、アプリを操作してくれるらしい…。

これって凄いこと?なんだろうけど…

スマホで自分で操作した方が早くない…?

小さな端末に独り言のように話しかけるのは…気恥ずかしいし…。

今ひとつ…ニーズを見出せないのは…私だけ?

Open Interpreter 01 Lightについて

概要

Open Interpreter 01 Lightは、Open Interpreterを搭載したオープンソースのポータブル音声インターフェースです。2024年3月21日に発表されました。

特徴

  • 音声操作: コンピュータを音声で操作できます。
  • 画面表示: コンピュータ画面の内容を表示できます。
  • アプリ操作: インストールされているアプリを操作できます。
  • 学習機能: 新しいスキルを学習できます。
  • オープンソース: ソースコードが公開されており、自由に改良できます。
  • ポータブル: 持ち運び可能なサイズです。

01 LightとOpen Interpreterの関係

01 Lightは、Open Interpreterの機能を簡単に利用できるようにするためのインターフェースです。Open Interpreterは、ChatGPTに搭載されているAdvanced Data Analysisのローカル版であり、プログラミングを介した様々なタスクを実行できます。

01 Lightの利用方法

01 Lightは、以下の方法で利用できます。

  1. 公式サイトから購入する。
  2. 自身のRaspberry Piで構築する。

購入方法

公式サイトから購入できます。価格は、199ドルからです。

構築方法

詳細は公式ドキュメントを参照してください。

01 Lightの将来

01 Lightは、まだ開発段階ですが、将来的には以下のような機能が追加される予定です。

  • マルチモーダル操作: 音声だけでなく、ジェスチャーやタッチ操作にも対応する。
  • スマートホームとの連携: スマートホームデバイスを音声で操作できる。
  • AIアシスタント機能: 予定管理や情報検索などのアシスタント機能を提供する。

関連情報

その他

01 Lightは、オープンソースプロジェクトであるため、開発コミュニティからの貢献が期待されています。

by Gemini


New Posts:

Adobeバリアブルフォント「百千鳥 VF」をいじってみた!

2025-02-15

スケッチで画像を編集できる!?「FramePainter」

2025-02-06

結局のところ…「Adobe」一択

2025-02-02

AIデザインツール「Kittl」

2025-01-17

「Stable Point Aware 3D」...画像を1秒で3Dモデル化

2025-01-15

あけましておめでとうございます。

2025-01-06

Gemini × Imagen3 = 画像生成AIアプリ「Whisk」

2024-12-18

画像生成AI「Midjourney」アップデート...Profiles and Moodboards

2024-12-17

Google...動画生成AI「Veo 2」リリース

2024-12-17

Midjourney...複数ユーザーがストーリーを共有できる「Patchwork」発表

2024-12-15

動画生成AI「Sora」一般提供開始 → 新規登録を即日停止 → 新規登録再開

2024-12-14

Adobeが写真に写り込む反射を除去できる「Reflection Removal tool」を発表

2024-12-14

Stable Diffusionと連携してブラウザ上で漫画制作できる「Manga Editor Desu!」

2024-12-13

Googleの動画生成モデル「Veo」が使える!?

2024-12-08

Googleの3D空間環境生成AI「Genie 2」

2024-12-08

テキストや画像から高品質な3Dモデルを迅速に生成する「Edify 3D」

2024-12-07

新たな脅威...ビジュアルプロンプトインジェクション攻撃とは...

2024-12-01

Dream Machine サイトリニューアル

2024-12-01

人物画像生成特化型AI「FLUX Portrait Trainer」

2024-12-01

「FLUX1.1 Pro」で使える...「FLUX.1 Tools」登場

2024-11-23

1枚の画像から空間を生成!?「DimensionX」

2024-11-17

AI生成された画像からプロンプトを抽出する...

2024-11-15

最高性能?のアップスケール画像生成AI「DreamClear」

2024-11-12

生成AI検索に移行する中...Google Search Consoleに意味はあるのか?

2024-11-08

プロンプトキャッシングって?

2024-11-05

アプローチが新しい!?マルチモーダル画像生成AI「OmniGen」

2024-11-04

GitHub Copilotってなに?

2024-11-03

Runway Gen-3 Alphaの進化...

2024-11-02

実写動画を3DCGアニメーションに変換「Wonder Animation」

2024-11-01

Adobe Firefly Generate Video...まもなく...

2024-10-28

プログラミング知識不要でAIアプリケーション開発できる「Dify」

2024-10-28

コンピューターを操作することができる生成AI「Claude 3.5 Sonnet」

2024-10-27

Midjourney...新外部画像エディターについて

2024-10-24

Haiper 2.0...登場!

2024-10-23

3種のStable Diffusion 3.5 リリース

2024-10-23

高品質な短編動画を効率的に生成する動画生成AI「Pyramid Flow」

2024-10-22

文書、テキスト、画像などを構造化データに変換するOmniAIのOCRデモ

2024-10-21

イチゴが苦手な!?大規模言語モデル(LLM)

2024-10-20

電子インボイス国際的標準規格「Peppol」

2024-10-19

MidjourneyのWeb画像エディターが新しくなる?

2024-10-19

画像から音楽を生成するSuno AI「Scene」

2024-10-19

4096×4096ピクセルの高解像度画像を数秒以内に生成できる「Sana」

2024-10-18

Adobeの2024年10月14日リリースから「Adobe Firefly Video Model」「Project Neo」

2024-10-17

Geminiで画像生成AI「Imagen 3」が使えるように!

2024-10-14

Adobe...デジタル署名?発表

2024-10-13

生成AI×スマートグラス=個人情報丸見え!?

2024-10-12

画像から高解像度3D深度マップを高速生成「Depth Pro」

2024-10-08

開発者向けの生成AIプラットフォーム「fal.ai」

2024-10-07

人間やキャラクターを動画に合成できるビデオ合成AI「MIMO」

2024-10-06

Meta 新しいAI動画生成モデル「Movie Gen」発表

2024-10-05

TikTokのByteDance 動画生成AI「Doubao」シリーズ発表

2024-10-03

動画生成AI「Pika 1.5 」リリース!

2024-10-03

生成AI検索に対応した要約しやすいWebサイトとは?

2024-10-02

日本語性能世界一LLM「Takane」提供開始

2024-10-01

Gmailに返信メール生成AI搭載...

2024-09-30

代わりに電話をかけてくれるAIサービス

2024-09-29

多様な画像生成タスクを統合「OmniGen」

2024-09-28

人に説明するのも...生成AIに指示を出すのも...

2024-09-28

もはや...作業や処理は生成AIに任せ方が...

2024-09-27

日本人には縁遠い?「Llama」がアップデート

2024-09-26

より人間らしく…「Advanced Voice Mode」公開

2024-09-25

AIで「縁結び」スタート...東京都

2024-09-24

「生成AIガチャ」と言われる段階で...

2024-09-23

詐欺メールの削除から始まる日常

2024-09-23