電子ディスプレイを用いない,リモコンに搭載しやすい新しい印刷情報読み取り方式であるClearPlate を提案する.ClearPlate は,リモコンの透明な部分を読み取りたい範囲に重ねるだけでリモコン内部に搭載されたカメラを適切に位置/ピント合わせできる,安価で使いやすい新しい読み取り方式である.評価実験の結果,電子ディスプレイを用いた携帯電話の二次元コードリーダー以上の高い操作性が得られることと,その性能がFitts の法則の修正式で表せることが明らかになった.
"本論文では,文章を読む方向とそれに直交する方向を考慮した2次元のブロックを索引・検索のキーとする2次元文字ブロックインデクシング技術を提案し,書籍内の各位置にデジタルコンテンツへのハイパーリンク設置を可能にするシステムBookEnhancerを紹介する.従来,書籍内にハイパーリンクを設置する際はマーカーを用いる方法があったが,この手法は予め書籍内にマーカーを記載する必要がある.一方,システム上に書籍内のテキストと位置を関連付けておけばマーカーは不要である.すなわち,書籍内を撮影した画像をシステムに送信すれば,システムは画像からOCR(Optical CharacterRecognition)により抽出したテキストを検索語として位置を特定し,その位置に関連付けられたコンテンツを提示できる.このとき,大量の書籍の中から一意に位置を特定するためには,長く連続するテキストを検索語とする必要がある.ところが,一般ユーザが撮影した画像にはOCR誤認識が約35%発生するため,長いテキストには誤認識文字が含まれて正しく検索できないという問題があった.特に部分領域画像の範囲が狭い場合,抽出できる検索語数が少なくこの問題は深刻である.提案手法は少ない文字数で各書籍内位置に固有なパターンを表現できるので,OCR誤認識が発生する狭領域の書籍内部分画像から一意に位置を特定できる.73,231文書から1文書を特定する検証実験では,提案手法はノイズが無い状態で99%,ノイズが33%の状態でも92%の精度を示し,比較手法を上回ることを実証した."
計算機を用いた音楽制作におけるMIDIシーケンスデータ入力法のひとつに鼻歌入力法がある.しかし既存システムでは1音毎の区切りがうまくゆかないことによる変換精度低下が起こる.この問題に対して我々はタップ併用型Voice-to-MIDI手法を提案し,既にタタタ歌唱を前提とする既存VtoMシステムとの比較実験を行い,既存システムと比較して勝るとも劣らない精度で音高変換できることを示している.しかし,歌詞歌唱などの任意の発音の歌唱を許容する既存システムとの比較はこれまで行っておらず,本システムの有用性を十分に示すことができていなかった.そこで今回タタタ歌唱を前提としない,自由歌唱可能なシステムとの比較を実施し,本システムの有用性を明らかにした.
我々が会話を行う際には,発話や視線,指差しといった行動に一定の構造が存在する.このような会話におけるマルチモーダルな行動の構造を明らかにすることができれば,それを基にエージェントやロボットなどの人工物が今よりも自然な形で人とインタラクションを行うことが可能となる.しかし,会話的インタラクションの分析において従来使われている手法でこれを網羅的に,かつ数値的な根拠を持って取得することは困難である.このようなことを踏まえ,本研究ではデータマイニングの手法をインタラクション分析に取り入れることによって会話構造を発見することを試みる.これをインタラクションマイニングと呼ぶ.本論文では,まずインタラクションマイニングの具体的な手順について解説する.その後,3人の自由会話に対して本手法を適用し,従来研究で議論されてきた会話構造を自動的に発見することで本手法の有効性を示す.
本研究では,デジタルペンと無線通信機器を用いて学習者の紙への筆記を教師用計算機に集約し,集団授業におけるコミュニケーションを促進するシステムを構築・実践した.これまでの実践では,システムの持つインタラクティブシステムとしての効用を分析してこなかったため,筆記認識結果を学習者に逐次フィードバックする機能を用いて高校の数学授業で実践を行い,その後15名の生徒に対してインタビューを実施した.その結果,授業の演習過程の透明性が増したとともに,双方向性増加および机間指導の改善効果が見られた.結果を基に考察を行い,教室内の活動を舞台化のアナロジーで捉えることにより,システムがもたらすインタラクションを理解することができた.
本稿では,それぞれに流速が異なる複数の時間流を持つチャットシステム”Kairos Chat”を提案する.そして,実験により,提案システムの有用性を検証し,提案システムが有する異なる複数の時間流をユーザがどのように使い分けるかを検討する.提案システムを用いた実験結果より,ユーザは,流速の違いを自然に受け入れ,レーンごとに発言内容を意識して使い分けて,Fast/Slow レーン上で逸脱発言を随時行いつつ,Pushレーン上で議論の本筋に沿った発言をする行動を自発的にとることが見出された.また,本提案システムにて,対話の開始時から時系列に移動するレーンを追った場合には,推移状態が直線的になる部分と複数レーンをまたいだ部分が半々の状態で,対話が進行し,スレッド単位でみた場合も,直線的な推移が若干多いが,複数レーンをまたいで対話が進行していることがわかった.
メディアスペースは遠隔地間を接続する技術として期待されているが,未だ完成されていない.我々はメディアスペースに,ユーザがディスプレイに近づくと遠隔地にあるカメラが前方に移動する機能を追加した.この単純な機能により運動視差を伴って遠隔地の人の映像が拡大されることで,ユーザの接近動作が増幅される.そして,この可動式カメラがテレプレゼンスを強化することを被験者実験によって観測した.テレプレゼンスとは遠隔地の人とあたかも同じ部屋にいるかのような感覚である.カメラは移動しているにも拘らず,被験者はカメラが動いているのではなくズーム機能によって人の映像が拡大されていると感じた.しかし,可動式カメラの代わりにズーム機能によって人の映像を拡大した場合,テレプレゼンスを強化する効果は観測されなかった.これはズーム機能による映像の拡大には運動視差が伴わないからであると考えられる.被験者はカメラの機能について何も説明されていなかったが,ほとんどの被験者は自分の歩く動作に合わせて映像が拡大されているということに気付いていた.また,カメラの移動を遠隔地の人が操作した場合,テレプレゼンスは強化されなかった.
Push-pin はホームオートメーションのためのエンドユーザ向けプログラミングインタフェースで、ピン型の物理タグを用いて住人が手軽にプログラムを変更することができるものである。Push-pin のプログラミングモデルは stimulus-response モデルにもとづいており、ピンを使って接続された二つの機器の片方が操作されたり変化を感知すると、もう片方の機器にネットワーク越しに信号を送信し、機器を作動させる。例えば焦電センサが人の動きを感知すると照明を点灯させる、といった設定が可能となる。本報告では、push-pin システムの設計について説明した後、想定される応用シナリオを提案する。またプロトタイプの実装について説明し、GUI との比較評価実験の結果について報告する。
大画面壁面ディスプレイにおいて,影のメタファを用いたポインティング動作の運動モデルの構築を目指し,フィッツの法則に基づいた一次元のタッピングタスクを用いてポインティング時間を評価した.実験結果から,画面上の動きでなく手元の動きにフィッツの法則を適用できることがわかった.さらに,関連研究とは異なり,ターゲット距離とターゲットサイズを分離したモデルは有効ではなく,ディスプレイとユーザの距離に関係なく通常のフィッツの法則を適用可能であることが分かった.