d0iの連絡帳

気がむいたら書く

最近何を考えているのか

最近何にはまっているのか、整理を兼ねてすこしだけ書きます。

元々はDNS*1からP2P*2、DHT*3RFID*4 、DHT+RFIDでトレーサビリティ*5、トレーサビリティからRFID抜いて分散システム上のオブジェクトトレーサビリティ*6、みたいな検討をしてきました。振り返ると一貫して、Identificationとそれに対するメタデータの取り扱いをやっていたことがなんとなくわかります。しかし、本人としては別にIdentificationをやれば終わりだなどとは思っておらず、この仕事が「実空間の情報による補強*7」に役立つだろう、という期待のもとで研究を積み上げてきています。


一方、実空間の情報による補強、ということを考えた場合、どうしても問題になるのが実空間と情報空間の接点です。東大の落合先生を含めたIEEE1888/Live E!のグループや、古くはTinyOSやらMICAやSmartDustなどといったプロジェクトがありましたが、こういった研究では、まずは実空間のデータを情報空間に吸い上げるための枠組みを作っています。IEEE1888でようやくXMLを本格的に使いはじめましたが、ほとんどのプロジェクトはデータスキーマに対する考え方が薄いという問題があります。

スキーマの重要性というのは、いわゆる セマンティックウェブ と呼ばれる技術にかかわる人々が声高に叫んでいます。曰く、全てのデータをコンピュータに理解可能にする、曰く、オントロジ*8メタデータによりデータ要素間のネットワークを作る、等々といった研究をされている方々です。個人的には、データをコンピュータが理解するっていうのはつまりどういうことなのか、いまいちよくわかりません。また、オントロジはフレーム問題*9を解けないので、オントロジで記述できることはせいぜい関係性だけだろう、と考えています。

しかし、この「関係性の定義」だけ考えても、データの文脈は重要な意味を持っています。具体的には、42、という数字だけでは何の意味も持ちませんが、これが温度なのか湿度なのか降水量なのか、目覚まし時計のカウントダウンなのか、エレベータに乗っている人数なのか、それとも、「生命と宇宙と万物についての究極の疑問の答え*10」なのかがわかれば、多少は意味を持ってきます。例えば、コンピュータはその値の意味を理解することはありませんが、他の値 (例えば高温警報閾値) と比較できるかのチェックや、物理量同士の変換 (摂氏と華氏、あるいは温湿度から快適指数への変換等) が可能になります。

そういう意味において、データがデータとして単独で存在している、現在のセンサネットワークに対して、明確なスキーマを行き渡らせることが、実空間と情報空間との境界面を強化し、特に情報空間の特性の一つである、さまざまなソースから情報を統合して最適化可能である、という利点を活かすための大切なステップだと思うに至りました。

シングルドメインでは単純に動かせていたものが、マルチドメインになった瞬間にちっともうまく動かない例は至るところにあります。DNSはどうしたわけかこれに成功していて、学生の時に最初のテーマにDNSを選んだ*11自分としては、マルチドメインで動くのが当たり前で、動かないほうが気持ち悪いわけです。異種ドメインを考慮した識別やトレーサビリティの問題から、データスキーマの問題に一段抽象度が上がったのは、そういう動機があったのかもしれません。

で、具体的に何をやっているのか、というのは、まぁ、お会いしてお話しできればと思います。一応、お仕事ですので、こういう場に具体的なことを書くのは若干はばかられます。ただ、情報処理学会UBI研究会、CDS研究会、IEEE ICCE2012とかで喋った内容もあるので、完全にヒミツ、ということではないので、まぁ、適当に。ただ、こういう話は広げていかないと、なかなか難しいなと思ったので、いろんなところで議論させていただければ幸いです。

*1:ドメイン名システム: インターネットの電話帳です。

*2:サークルみたいに、みんなでがんばって何かしようよ、というコンピュータを作る研究です。対義語 C/S(クライアントサーバ) お客さんとお店の関係

*3:Distributed Hash Table: 分散ハッシュテーブル、説明は難しいですが、簡単に言うとP2Pたらいまわしを上手にやるためのものです。 / 詳細な説明は東工大首藤研長尾君のblogを見てください。

*4:Radio-Frequency Identification: 電子タグを用いた商品の識別です。ID符号化方式の研究をこっそりしてたりとか。

*5:モノがたくさんあったときに、どのモノがどの工場からいつどのように出荷されて、どのように配送されて手元に来たのか一つひとつ管理するための仕組み。

*6:コピーされたデータ同士の関係の記述。博士論文はこれで書きました。

*7:今でいうところのCyber-Physical System

*8:概念と概念との間の関係性の集合、って説明になってないな。えーと、シソーラス(言い換え語事典)みたいなものだとお考えください。

*9:コンピュータが「理解する」という概念は、「理解」の枠を一段広げると振り出しに戻ってしまい、いつまでたっても理解するということを理解できない、という問題。人間は、ほどほどの所で「理解してないけど何となくこう」って判断できますけど、コンピュータにとってそれは難しい。

*10:銀河ヒッチハイク・ガイドより

*11:厳密には、当時の大ボスに「お前はDNSをやれ」と選ばされた