Web2.0部会 開催案内
 

【参加募集】2/6★3部合同部会『イベント・カレンダー、講演文書、ヒトやグループの情報を如何に魅せるか』ご案内fromWeb2.0部会: 第7回月例ミーティング(2007年度)

皆様、
標記の会合のご案内をさせていただきます。本メールは、Web2.0部会の活動の流れからのご案内となります。
会員企業各位におかれましては、お誘い合わせの上、是非ご参加ください。

前回1/10のWeb2.0部会には、17名が参加され、インフォテリアさんのSaaS型イベントカレンダーc2talk.netのご紹介と、IBMさんのProject Zero (SMB向けLLマッシュアップ開発環境)のご紹介、という大変貴重な講演を堪能しました。とともに、XMLDB部会さんの発案された、XML ConsoritumサイトにあるコンテンツをXMLDB化して、「2.0」的なサービスの設計、試作をしてみよう、というプロジェクトについて、Web2.0部会としても非常に活発な議論が展開しました。非常に長い議事ログに、その痕跡が見てとれるかと存じます。
ご講演の甲斐さん、根本さんをはじめ、ご参加された方(特に休暇をとって大阪のご自宅からSkypeで参加された玉川さん)、ご関心お寄せいただいた方に厚く御礼申し上げます。

2/6 は、いよいよ3部合同部会です。標記のように、『イベント・カレンダー情報、講演文書、ヒトやグループの情報(+その履歴)を如何に魅せるか』 というテーマで、いよいよXMLDB部会さん、WS実証部会さんと合同で、XML Consoritumサイトにあるコンテンツの「2.0」的なサービス化のプロジェクトを本格的に議論いたします。

奮ってご参加ください。
本プロジェクトにご関心の向きで可能な方は、1/30午後品川のアドソル日進さんで開催のWS実証部会にも是非参加されてみてください

■日時:
2008年2月6日(水), 【13:00】- 16:30
■場所:池袋:サンシャイン国際文化会館(Sunshine60,ワールドインポートマートより奥の造幣局側の建物)
     709号室会議室
http://www.jagat.or.jp/PAGE/2008/access/access.asp


プロジェクタ2台はメタデータ(株)から持ち込みます。飲み物、ネット接続環境等は各自ご調達ください。

アジェンダ案


部会活動は久しぶりという方も、ご新規の方も、お誘い合わせの上、
どうぞ、奮ってご参加くださいませ。本メールは、内容に変更がなければ
無断転載、転送、歓迎いたします。CC (Creative Commons)で書くと

BY XML Consortium
NC Non-Commercial
ND No Derivative works

となります。どうぞよろしくお願いいたします。


なお、配布資料の必要部数把握のため、下記から申し込みフォームから送信(メール送信になります)、あるいは、あて先、SubjectをコピペしてWebメール等から送信をお願いします。

第7回Web2.0部会参加届

ご氏名:                メールアドレス:
 
ご所属:

ご出欠: 出席 or 欠席
出席 欠席

コメント等:


付録:

以下、1/10 のWeb 2.0の部会、1/23のXMLDB部会の議事録を引き継いで、主にセック川口さんとメタデータ野村の間でメール討論した内容の抜粋です。ご参考まで:


------------------------------------------------
前提:
  - 既存コンソーシアムサイトの各コンテンツ、
    特にセミナー情報ページ(一覧、プレゼン資料)から検索用のデータを
    抽出してXML化し、XMLDBに格納する。
  - 利用者からの要求に従い、Web APIで出力したコンテンツをマッシュアップ
    して、いろいろな見せ方を実現したい。

・セミナーのリストページから開催日や発表者の抽出が可能。
  →各欄に、複数のPDFが貼り付いていることがあるので、それらを複数の講演
    者、サブタイトルごとに別レコード(サブレコード?)化したい。同一の
  講演コマなのでこれらの間で日付が違うことは有り得ないから各レコードに
  人名や演題以外のメタデータは複製すれば良いでしょう。(野村)

・DB格納時に日付の書式の正規化が必要。
  →バリエーションはそれほど多くないはず。 
   HTMLスクレイパーでどこまでの精度でメタデータ抽出、そして正規化ができ
 るか、というチャレンジなので、WS実証部会さんに頑張っていただく(か別の
 主体が実行するか)が吉、と思います。HTMLスクレイピングは、
 YahooPipes最新版にある程度のものがついていたり、インフォテリアさんの
 c2talk.net APIにも、(おそらく日付に強い:)HTMLスクレイパー機能が搭
 載されています。これらを試してみるのも楽しみですね。

※6日に、誰かがその場でやってみせるとか。。(野村)

・DBに格納するXMLデータは、PDFから抽出したテキストとメタデータを想定。
  →API出力時はフィード(RSS等)形式に合わせておけばメリットが大きいが、
    DB本体には多目の情報、構造を保持することも出来る。
    文書メタデータとして汎用性の高い拡張は、やはりDublin Core。
    また、RDF, RDFS, OWLという本家セマンティックWebのリソース管理のメタ
    データ語彙を付与する案もある。(野村)

・DB部会側はどちらかと言うとSIer的発想?
  検索方法や一覧結果として必要な情報を想定して、最適なXML構造やデータ
  投入方法を設計、というスタイルのようだ。(川口さん)
  →3部会合同は、異文化のすり合わせ、コラボも面白い、生産的なポイント。
    (野村)
  →サーバ層でも、IBMのmashup hubも使ってXMLを他由来のXMLとマッシュ
    アップするなどが考えられる。(野村)

・3部会とも、全員がエンドユーザの気持ちで、使いやすくて便利、役に立つ
  サイトというかWebアプリケーションを追求している合同プロジェクトという
  ことで如何?
  様々な意味で良いアイディア(「良い」=欲しい情報に瞬時アクセス、一覧性
  (履歴、空間的広がり)、話題性、開発コストパフォーマンスなどの観点で)
  は誰が言い出したかに関わらず採用されていくのを原則とすれば、うまく進む
  ような気がする。(野村)
  →Web API提供側のXMLデータハンドリングにて、XMLDB、API、マッシュアップ
    を(一般的に)どう使い分けるのがよいか議論出来ればと思う。(川口さん)
  →XMLDBがマッシュアップ用のAPI (REST) を提供できるのではないか。
    途中にWAS, Web Serverが入るので、製品レベルでは、API提供用のSDKの
    ようなものになるとも思う。(野村)
--------------------------------------------------