XML Consortiumバナー

 2008/4/18 Web2.0部会議事録

議事録担当:  メタデータ株式会社 松田圭子

Kawaguchi-san

■日時:2008年4月18日(金), 13:30-18:05
■場所:日本ユニシス本社ビル 6階 セミナールームA
http://www.unisys.co.jp/com/honsha.html

■参加者:7 名(Linuxコンソーシアムさんからのゲスト1名:佐藤さん)

■アジェンダ案:


・13時30分~15時00分 XML出力インスタンスのレビューと、RSS配信文書の設計
・15時00分~16時30分 プラットフォーム、言語ごとに分かれての議論、マッシュアップ試作
            
・16時30分~18時00分 デモ(類似のマッシュアップをみつけてここをこう変える等でも可)

 

No. 内容 作成者
 1  ユーザ情報の管理方法(XMLDBに一緒に入れる、他のRDB等に入れる、etc.) 川口
 2  XMLDBにて、特定の要素に対するアクセス制御の実現方法(セミナー資料本体の更新は事務局のみ可能、ユーザはタグとコメントのみ編集可能とする) 松山
 3  サーバの用意(マッシュアップアプリの実装時に、公開APIはインターネットからアクセスする必要がある) 村垣
 4  XMLDB部会で用意するAPI構成の再検討(JDBCとREST APIの併用案は、松山さんからダメ出し) 松山


 


 


■議事メモ:



●XMLDB部会での検討状況:川口さんより説明

---
XMLDB部会の状況報告
REST APIはRoRにしたら…等、発言あり。
スキーマが自由に変えられることを見せたいのだが。。という話もあり
内部での意見すりあわせ必要

---
サイバーテック山口さんの資料をもとに

文書取得
 全件取得、ID指定で取得 タグ付けして取得
検索、削除
XQuery検索

XML実証部会メンバに個々にインストールして動かしてもらうAPI
実働は5月連休あけの予定

---
XMLスキーマ検討

ジャストシステム加藤さんからのXML(自動生成分)について
・手入力らしい(人名に元資料と違う文字あり)
・タグ名が意味不明のものもある
(ツールがはきだすタグそのものを使っている)
→勝手タグ、わかりにくいのでは

PDFから作ったXML
(ジャストシステムの社内システム、使い方改善はできるだろう)

加藤さんからの説明資料(最新版)からも検討
keywordタグが複数かつさまざまな意味の内容を含むのは問題では

ツールの制約によってメタデータ構造が決まるというのは
XMLコンソーシアムとして発言していいものか…

dcを活用するのが適切ではないか?:文書メタデータの管理なので
---

●RSS提供について:松田 

今回なぜRSSを、どういう意味で作るか

・多種多数のクライアント開発プラットフォームが簡便に対応できるようにするため、 
・Mashup目的から見て、汎用性の高い扱いやすいサマリデータである
 (オリジナルのXMLを作る前に、シンプルで普遍的なものがあるから使おうと
 いうスタンスRSS2.0 はdcを含んでいるし。コストかけてまとめ上げられた
 コモディティーなので利用するのが合理的だろう)
・更新情報の発信ではなく検索結果を動的に自動生成されたもの(を想定し
 Weekデモ用には手で作る)
 静的なデータはDBがある。

デモ向けにどのくらいの実例がほしい?
・1チャンネルで10数アイテムあればOK(佐藤さん)

どういう内容で:
・1ファイルは1検索結果を想定、1アイテムは1概要に対応がよいのでは
 理由:概要がRSSの内容のメイン要素だから

・RSS2.0(Googleブログ検索結果RSSを参考に)
・dcのどの要素を取り込むか検討
 2007-12-04 その資料を発表したイベント日が最優先
 などでドキュメントの関連性
 dc:audience
   * education levelでないのがよいか。
   * valueについてはオープン 例:"SIG Web2.0" どう?		→興味の分野、
	  はどう?→一致する場合にはsubjectがよかろう
    * なにをする人、というのでどうか
  * 検索する側の都合を考えた目的とかはここになるか。そこまでつけなくてもいい?
	dcの管理するのは文書(リソース)相互関係であり世界観とか
	その中の位置づけ、価値、評価づけとかはない(それはdcの外ではないか)
	→それはdc以外のnamespaceでランキングとかになる。。

       イベント・セミナー資料はイベント特有の要素が必要だろう→拡張するか

方針を以下としよう
 RSSは他の名前空間を使ってOK、対応はアプリ次第(未対応なものはスルーする)
 1)本来dcで分担すべき部分はそれを活用
 2)dc拡張で対応できる部分はそれを活用
 3)それ以外の要素が発生したら別の名前空間を活用することを検討


作成方法:
手でやるのが最適という実験結果について
 スクレイピング実験(Yahoo!pipes):イベント頁のソースが僅かに違うだけで全然動かない(デモ)
http://pipes.yahoo.com/pipes/pipe.info?_id=6bc1cbf0c82ea677e75cee7f0ab4b2ba
原因:元々構造が無い。無い袖は振れない。

今回の結論:RSS形式案を松田がまとめてML等で連絡、意見を反映
アプリ作成者による自由な拡張OKとする
デモ時にはまとめる予定(個々のRSSファイルを適切な場所に配備するのでもよい)
実データの作成については分担を改めて依頼する予定

 

-- 休憩 --

 

後半 Antennna Toolの紹介、 RSSインタフェース

Antennna Tool
●Anntenaデモ、RSSとの連携案
Linuxコンソーシアムリッチクライアント部会佐藤さん(ビズリンク)
JavaによるリッチクライアントAnntena
マッシュアップ(はてな、bidders、形態素解析)
Viewをエンドユーザがドラッグドロップで変更できる

RSSリーダ的機能あり、そこからブラウザ機能やマッシュアップへ連携
(XMLコンソーシアムの拡張RSSにも対応部分を記述できる見込み)

コンポーネント指向でプログラムを作るというアプローチ
動くものを→「アンテナツール」sourceforge.jpにプロジェクトあり

クライアント型SOAの概念
java webstart を使って起動。IdbAを使う。
OPMLでブックマーク情報をとってくる
ブックマーク先のRSSをとってくる
機能を拡張できる
SATP通信でリッチクライアントとWebページ間でのドラッグドロップできる
コピペで再検索するのを減らしたい「キーワードタブ」
キーワードから商品情報
イベントドリブン的につないでいる

クライアント側マッシュアップの利点
ファイヤウォール内の情報が使える。(社内情報マッシュアップに適する)
スクリーンスクレイピング IdbAのを使った

はてなRSS使っている
javaでRSS各バージョンからのインポートが可能なライブラリを入れている。
新しいメタデータを取り込みたい(自前でつなげられる)

ラッグドロップで機能追加
IEコンポーネントをjavaでくるんでいるのが現状
もっとリッチな実装にするには接続を自前で書かないとかも

PDF表示については作り込むか。別の見せ方、関連情報を見せるアプローチ

---
●どんなアプリを作るか:ヒント、アイデアの種として

・タイムラインAPI
http://simile.mit.edu/timeline/

 タイムラインを使ったアプリ例:Author

それらを見ながらディスカッションで出た話題:
同時代の事件、ニュース、トレンド
(ニュースサイトとの連携したい)
・この資料は「時代遅れ」です を表示したい
 →新バージョンへのリンクが欲しい
	 has_child  x でも has_parent はできそう
 同一ジャンルの解説について時代順に見たい
 関連ニュースなど見ることで新情報の存在を予測できるかも
 孫情報ができたら子情報へのリンクをfix ...
	replaceされたという情報の固定をしたい
 論文の検索:片方向検索 ひとつ「ふるいの」が見つかってそれっきりは困る
 →「見る人の自己責任でタイムラインでチェックしようよ」
 データベース上で情報を持つのでない解決策。

 左クリックで詳細:SIMILE Timelineの内部機能かも

 文書アクセスへのニーズ
	Authrから:キーワード、ジャンルで絞り込み Timeline上での動作
 イベント記録・資料アクセスへのニーズ
 	Eventfulから:Whenで絞り込み(過去○ヶ月とか、いつ頃とか)
		いつ頃:○氏が○部会リーダの頃
		(あとで実装するかも、デモ時には自力でデータ持つかたち)
		 →総会議事録にある

  	※部会オブジェクト、所属企業一覧、などなど
	 持つという話題がかつてあった。

・API探しとドキュメント閲覧アプリUI例として:APImatch紹介
googlemapsmania見る。

技術マップ+ブログレンジャーTG 地図上に関連データ配置

軸足メタデータによるデータ連係
加工によって、存在しなかった情報を作り出す

BookExprolerで文書検索できないか
関連語から検索についてXML関連語だけをとりこむように
XML用語集を使うことができるのでは
通常の入力はAmazonから。→Amazon形式にデータ変換できれば可能か?
近い部分もあるがシンプルな流用は難しいかもしれない、検討を。

---------------

【宿題】

XMLDB部会25日へのアプローチ;川口さん
XML構造を改善して提言してもらえないか。。
スキーマ案をメールで提出することはできる(川口さん)
あとですりあわせ
拡張RSSのまとめ:松田さん

RoRチーム
 RoR部分 松田
 JavaScript 川口さん(Timeline部分 SIMILEでリソースの情報源をクローズドで使う調査から)
	→荒本さんにHelp求めるのもあり
Flash	ITフロンティア白井さん(森本さん?)
リッチクライアント 佐藤さん
XSLT	小林さん
Python 荒本さん
各担当者(チーム)がやりたいアプリを任意に開発してOK
Silverlight

データは、RSSでは半自動で適宜変換・調整したものを用意する。
各クライアントが必要とする要素を好きにもりこんでOKとする。
(要素とアプリのやりたいものにはかなりの関係性があるから。)
→デモを見せる状況では、サーバ上に全アプリが要求する

OnSheetに登録して計算・加工する連携はありえる
IdeaExchange的アプローチ、おもしろいマッシュアップ見つけたら紹介しあうとかする?
XMLコンソーシアムの文書分類のカテゴリ分けをする担当者募集
RSS欲しい人が追加するのをOKとする
カテゴリについては事前の合意が必要、タグでいいのか
数十ではなくて10数くらいの大分類でOK、目安として連休前で
小林さん、西さん

カテゴリ:XMLコンソーシアムがどういう情報を提供しているかというカテゴリ分け
see programmablewebのタグ分類(悪い例)
現状では部会名だけでもOKかも。それはpublisherに入る。じゃなくてカテゴリにするならdc:subject

・どういうカテゴリー名にしたらいいか迷った人は小林さんと西さんに質問できる
助言担当としてください。
理由、カテゴリとして入るもの

RSS仕様とりまとめ&1stサンプル作成
それについて公開して意見をもらい、
RSSデータ作成については個々に作るのを依頼すると思う


Weekの発表は?6/6の発表
デモと、そのアイディア、インタフェース仕様などを具体的に説明するスタンスで。
発表枠:アプリデモ最大で1時間あれば。ひとつ15(~20分)で3(~5)を目指す

6/3午後 Web20部会での講演
・Project Zero+最新状況:IBM根本さん
・OnSheet C2talk Lino :インフォテリア甲斐さん 
・Silverlight : 宮崎さん

★★ 次回

Web2.0部会
日時:2008年5月12日
場所:メタデータ(株) or  他社さん

議題候補:
合同プロジェクト:

・試作アプリのレビュー

・総会、XML コンソーシアムWeek準備


----

最近のWeb2.0部会議事録バックナンバー:

2008/3/28 XMLコンソーシアムWeb2.0部会 議事録

2008/2/29 XMLコンソーシアムWeb2.0部会 議事録

2008/2/6 XMLコンソーシアム 3部合同部会議事録

2008/1/10 XMLコンソーシアムWeb2.0部会 議事録

----

以 上