Appleの初の生成AI 「Apple Intelligence」 機能まとめ。テキスト・画像の生成、Siriが賢さアップなどの恩恵がAppleデバイスにもたらされる

現地時間6月10日、Appleは開発者向けイベント 「WWDC24」 の基調講演を開催。同イベントのなかで、「Apple Intelligence」 と名付けられた新しいAIスイートを発表した。

「Apple Intelligence」 は、iPhoneやiPad、Macで利用できるAI機能。それぞれの次期OS 「iOS 18」 「iPadOS 18」 「macOS Sequoia」 で実装され、まずは米国英語環境において今秋ベータ版として提供が開始される。日本語を含む他言語への対応は2025年以降を予定している。

利用できるデバイスは、iPhone 15 Pro/iPhone 15 Pro Max、M1チップ以降を搭載したiPad、Mac。なお、一部機能については米国英語環境においても2025年以降の提供となるようだ。

スポンサーリンク

「Apple Intelligence」 とは何か

今回発表された 「Apple Intelligence」 は、Appleデバイスにネイティブ実装されたAI機能だ。大規模言語モデルを利用して、言語の深い意味合いまで理解し、テキストや画像の生成など様々なシーンでAI機能を利用できるようにした。

また、ネイティブ実装しているためアプリ間で横断するように情報がやりとりできるのも同AIの特徴とも言える。

AI機能は、iPhone、iPad、Macの各OSの至るところからアクセスが可能。また、一部Siriにも統合されており音声を利用して使用することも可能だ。

Appleは同AI機能を提供するために長年をかけて研究を重ねてきたとしている。特に重視するのは、個人情報 (パーソナル) な情報の取り扱いについて。「Apple Intelligence」 は、オンデバイス処理とクラウド処理の両方を用いて実現しており、プライバシーに関わる情報に関してはすべてオンデバイスで処理する仕組みになっているため、安心して利用できるとAppleはアピールしている。

また、外部の会社の力を借りる形となるが、OpenAI社の 「ChatGPT」 との連携も行う。ChatGPTベースで動作するSiriを利用することも可能だ。

「ChatGPT」 は最新の 「GPT-4o」 をサポートするため、答えられる幅が従来のSiriに比べて大幅に向上させることが可能だ。「ChatGPT」 ベースのSiriに対して、写真・ドキュメント、PDFを用いた質問もでき、その際にはプライバシー配慮のためChatGPTに対して写真を共有していいか尋ねられるという。なお、「ChatGPT」 の有料会員の場合は、「ChatGPT」 が提供する有料機能を利用することも可能だ。

「Apple Intelligence」 が利用できる機能は以下。

機能①:テキストの作成や校正、要約が可能

記述ツールにおいては、文章の書き直しや校正、要約が可能に。文章のトーンについても書き直しを任せることもできる。

メールやメッセージ、さらには記事の原稿を書いたり、ブログのエントリー、製品レビューを書く際にも役立つだろう。対応アプリは、メール/メモ/Safari/Pages/Keynoteなど。また、他社製のアプリについても利用することが可能だという。

機能②:画像生成

「Apple Intelligence」 はテキストの生成だけでなく、画像の生成も可能だ。

画像の生成には 「Image Playground」 を利用。同アプリの入力欄に、どんなイラストを描きたいのかテキスト (プロンプト) を入力することで、イラストを作成することができる。

画像のスタイルは 「スケッチ」 「イラストレーション」 「アニメーション」 の3つ。利用料は無料で、何度も作り直しすることが可能だ。

この画像生成機能はOS全体に組み込んであるため、メッセージやメモ、フリーボードやKeynote、Pagesといった各種アプリケーションで利用することが可能。たとえば、写真アプリに入っている写真の中から人物の顔を認識しており、これを利用して楽しい会話をすることができるという。

具体的には、友達の誕生日を祝いたいときに、友達をケーキや風船、花で囲んだ写真をメッセージで送ることで、一段とにぎやかなコミュニケーションができる。また、お母さんに 「いつもありがとう」 とお礼を言いたいときには、ヒーローのマントをつけた画像を送ることができる。

また、メモアプリに入っている画像をApple Pencilで囲むことで、イラストを書き換えることもできるほか、何も書かれていない空欄を空欄を丸で囲むことで 「Image Playground」 を用いたイラストを作成することができる。その際は、周囲に書かれているメモの内容を把握し、それにあったイラストを描くことができるという。

機能③:画像のAI編集

写真アプリに入っている写真をあとから見返したとき、残念な写真に感じることはないだろうか。「Apple Intelligence」 を利用すれば、過去の写真をより綺麗なものに変えることができる。

Appleは、「iOS 18」 の写真アプリに新しいクリーンアップツールを導入している。これは写真の背景から不要なものを削除する機能だが、この作業を 「Apple Intelligence」 にお願いすることが可能だ。彩度やコントラストを調整する際にも 「Apple Intelligence」 に音声でお願いすることが可能だ。

また、写真アプリのなかの写真も 「Apple Intelligence」 を利用することで、自然言語で検索することが可能になる。たとえば、「ステッカーを貼ったケイティ」 と書き込めば該当する写真を見つけ出してくれる。ビデオクリップについても特定の瞬間を見つけることができるとのことだ。

機能④:録音データから文字の書き起こし

これまでAppleは音声の録音機能は提供してきたものの、書き起こし機能は提供してこなかった。しかし、今回発表された 「Apple Intelligence」 を利用することで、音声データからの文字書き起こしをさせることが可能になる。

「iOS 18」 からメモアプリで音声録音が可能になり、この音声データを用いて 「Apple Intelligence」 を利用した音声の書き出しをさせることが可能だ。

もちろん、メモアプリでテキストを入力しながら音声を録音することができる。ただし、 録音を終了した段階で書き起こしするため、書き起こしとテキストの入力の両方を同時に行うことは難しいようだ。

また、この書き起こし機能は、電話アプリでも利用することが可能。通話中に録音を始めると自分だけでなく相手にも録音されている旨が通知されるため、安心して会話することが可能だ。

機能⑤:通知に優先度をつけられるように

「Apple Intelligence」 は、毎日たくさん送られてくる通知のなかから重要なものを確実に受け取れるように、優先度の低い通知の表示を最小限に抑えることができる。

例えば、当日のディナーの招待状や搭乗券に関するメールなど、最も緊急性の高い通知が通知の上部に表示される仕組み。また、メールの受信トレイにおいては、各メールの冒頭数行をプレビューするのではなく、メールの内容を要約したものが表示されるようになる。もしかすると、「いつもお世話になっております。」 が表示されなくなるのかもしれない。

さらに、Smart Replay (スマート返信) 機能として、返事の内容をある程度提案してくれる機能も利用できるという。

機能⑥:アプリを横断して動作させられる 「アクション」

「Apple Intelligence」 は、OSにネイティブで実装されているAIということもあり、複数のアプリケーションを横断して利用することが可能だ。

また、あなたが頻繁に使うアプリから最も関連性の高いデータを引っ張り出して利用できる。たとえばEメールやカレンダーのイベントを見つけ出したり。さらに、画像の認識機能を利用して、あなたが見ている画面の内容も参照できるようになっているという。

具体的なユースケースとして例に挙げられているのが、会議の開始時刻が変更されて娘の演劇発表会に間に合うかわからない時。「Apple Intelligence」 はユーザーの娘が誰なのか、そして娘が数日前に送ってきた発表会の詳細、そして会議の場所と時間、周囲の交通状況のトラフィックを予測し、娘の演劇発表会に間に合うか、ざっくりと計算してくれるというものだ。

また、「お母さんとオリビアと私が写っている写真を全部見せて」 と言うと写真アプリから該当する写真を表示したり、「妻がこの前送ったポッドキャストを再生して」 と言うとポッドキャストアプリから該当するコンテンツを再生させられる。

機能⑦:Siriがより賢く

「Apple Intelligence」 によって生成AI機能を獲得したiPhone、iPad、Macでは、Siriの認識・応答がより賢いものになる。ユーザーの言葉を正確に聞き取るだけでなく、ユーザーの発言の真の意図を理解することができるため、仮に多少のいい間違えをしたとしてもレスポンスすることが可能だ。

例えば 「東京の明日の天気は?…じゃなくて横浜の天気は?」 と聞いた時にも、ちゃんと横浜の天気を答えてくれる。

また、Siriに自分が何を聞きたいのか整理できていない状態で話しかけてしまうことがあると思うが、多少の思考時間が空いてもSiriは返答することができる。また、前後の文脈もSiriは覚えているため前の会話を踏まえて会話することもできるようだ。

Siriにはこれまでの音声入力のほか、テキストで入力することもできるため、声で聞くことを憚られるときにはテキスト入力が便利そうだ。

機能⑧:オンスクリーンアウェアネス (2025年以降)

「Apple Intelligence」 は、デバイスの画面上に表示されている情報を利用して、アクションすることが可能だ。たとえば、友達がメッセージで新しい住所を送ってきたとき、メッセージのスレッドのなかで 「この住所を連絡先に追加して」 と言うと、Siriがそれを実行してくれる。

機能⑨:Genmoji (ジェン文字)

「Apple Intelligence」 の画像生成機能を利用して、新しい絵文字 「Genmoji」 を作り出すことができる。これは生成AI (=Generative AI) を利用して作成した絵文字であることから名付けられているようだ。

テキストの入力欄にどんな画像を作らせたいのか書き込むことで、簡単なイラストを作成することができる。デバイス上のキーボードから直接作り出すことができ、写真アプリの中に入っている写真に写る人の顔から 「Genmoji」 を作り出すこともできるという。

ステッカーにして友達に共有したり、メッセージに対してインラインでGenmojiを加えることもできる。

(画像:Apple)

Apple
FOLLOW US
タイトルとURLをコピーしました