【参加募集】5/12★文書管理2.0クライアントを作る:第11回Web2.0部会
標記の会合のご案内をさせていただきます。
会員各位におかれましては、お誘い合わせの上、是非ご参加ください。
前回(開催案内)は、アプリを実際に作る視点でインタフェースXML文書とRSSの議論の後、文書メタデータのセマンティクスの世界標準、ダブリンコアの仕様をレビューしました。この語彙、拡張語彙を用いて、意味解釈がずれない、スレ違わない形で、XML,RSS(,ATOM)内部の文書メタデータについても極力ダブリンコア、その拡張を用いたいという方針を決めました。同様に、本コンテンツ特有のカレンダー系、イベント系の語彙も(文書メタデータだけでないところが面白いです)、標準やデファクトに極力準拠し、どうしてもそれらでカバーできないマイナーな構造、語彙を独自に定義する必要がある場合にだけ、XMLコンソーシアム独自の名前空間を使用することにいたします。
これを、マッシュアップの大きなデータの流れで考えると、大元のストレージ、各種情報源からマッシュアップした構造情報を解釈し、少なくともアプリの直前ではこのように統一する、ということになります。それにより、広範なフレームワーク、既存アプリ、新規アプリで、このインタフェース文書を活用することができるようになります。これは、情報の幅広い公開・共有を目指し、フィードバックを狙うコンソーシアムのような組織にとって当然とるべき戦略のように思われます。
Linuxコンソーシアム・リッチクライアント部会さんからは、Antenna Tools開発者の佐藤さんにお越しいただき、デモ、解説をいただくとともに、深い議論に積極的に深い議論にお付き合いいただきました。
写真入り議事録です。
さて、2007年度の最終回となる今回は、XML Consortium Weekの直前に、つくってきたデモやデータの摺り合わせ、さらなるチューニングと、発表のポイントの議論を行う予定です。その場でも作りこみ、調整ができるような部会になるかと思います。
各開発言語、フレームワークのご担当は、今からでも遅くありませんので、入力のサンプルRSSがメールで届いていないという方は (現在1本。GW明けに10数本)、遠慮なく、前回部会出席者の野村、松田(メタデータ)、川口(セック)、小林(ユニシス)、西(東芝ソリューション;以上敬称略)の何れかまでリクエストください。
----------------------- RSS2.0での実装。 基本方針: item直下のrss語彙だけで、なるべく情報が揃うようにする。 (理由:一般RSSリーダでも意味が通じる出力にできる、簡単に扱える) 詳細や、複数PDFを扱う場合にitem直下から落ちる情報をサブアイテムへ。 使う名前空間は デフォルトがrss, 加えて dc, georss, xCal ,独自のxcr (XmlConsortiumRssの略) 項目(必須=*, option=無印, 複数可=+) ----------------------- 下記の構造をとるインスタンス文書はこちら。
<rss>
<channel>
*<title></title> "XMLコンソーシアム 文書検索"固定
*<link></link> 当面、サイトトップ
*<description></description> 検索項目と結果件数
<language></language> "ja"固定(使用言語 W3C定義)
<pubDate></pubDate> 検索日時(RFC 822形式、例"Sat, 07 Sep 2002 00:00:01 GMT")
*+<item>
*<title></title> 講演枠名
<description> イベント名<改行>講演枠の概要<改行>PDFタイトル
(複数PDFなら概要の後に改行後に各題名を","区切り文字列として連結)
</description>
<link></link> PDFファイルURL(複数PDFなら最適なひとつを)
<guid></guid> 同上(どちらかだけを使うRSSリーダがあるため双方対応)
<dc:identifier></dc:identifier> 文書データID(複数PDFなら最適なひとつを)
<author></author> 作成者(講師)名(複数なら","区切り文字列として連結)
<category></category> カテゴリ(現状ではタグ的につける)
<pubDate></pubDate> 講演日(RFC 822形式、例"Sat, 07 Sep 2002 00:00:01 GMT")
<dc:hasPart>
<dc:type>Image</dc:type><dc:source></dc:source> 代表図ファイルパス
</dc:hasPart>
+<dc:contributor></dc:contributor> 部会(注1)
<xcr:event> (注2)
<xCal:dtstart value="DATE"></xCal:dtstart> イベント開始日("20080425")
<xCal:dtend value="DATE"></xCal:dtend> イベント終了日
<xCal:summary></xCal:summary> イベント名
<xCal:description></xCal:description> イベント概要(テーマ含む)
<xCal:location> イベント会場名
<georss:point></georss:point> 緯度経度
</xCal:location>
<dc:audience></dc:audience> イベントの聴衆層(レベルでなく)
</xcr:event>
+<xcr:subitem>
<dc:identifier></dc:identifier> 文書データID
<dc:title></dc:title> 文書タイトル
<dc:description></dc:description> 文書概要
+<dc:creator> 著者、発表者 (注1)
<xrc:name></xrc:name> 名前
<xrc:company></xrc:company> 社名
</dc:creator>
+<dc:contributor></dc:contributor> 部会
<dc:source></dc:source> PDFファイルURL
<dc:hasPart>
<dc:type>Image</dc:type>
<dc:source></dc:source> 代表図ファイルURL
</dc:hasPart>
+<dc:subject></dc:subject> カテゴリ(現状ではタグ的に)
</xcr:subitem>
</item>
</channel>
</rss>
----------------------- 注1:creator, contributor の使い分けについて http://dublincore.org/documents/dces/ より creator はAn entity primarily responsible for making the resource. contributor はAn entity responsible for making contributions to the resource. コンソーシアムでの、保存されている文書データの扱いのスタンスによりますが、 「作成に主に関与した」=creator, 「作成に寄与した」=contributorと読めば creatorが著者や発表者、 contributorが部会、 となるのがよさそうです。 (ここはRSSとXMLで合わせませんか?) 注2:イベント情報の格納方法について、別の可能性 eventという独自要素を定義していますが、 イベントをひとつのリソースと解釈してデータ管理する考え方であれば 以下のように書くのがよいかもしれません。(やや、読みにくくなりますが)
<dc:isPartOf>
<dc:type>Event</dc:type>
<xCal:stdate>...
...
</dc:isPartOf>
■ほか考慮点、メモなど ・dc要素の選定時の参考資料 4/18に配布した資料 http://www.kanzaki.com/docs/sw/dublin-core.html に加えて、 2008年1月の改訂内容を含む資料 http://www.kanzaki.com/docs/sw/dc-domain-range.html を参考にしました。 ・1概要で1アイテム、の理由 実データを開いてみるとわかりますが、1コマ内で複数PDFがある場合、 それらは「単に枝番号であるべきところが別資料に分かれている」ものや、 「作成者が別だから別資料になっている」もの、 「話題が別で、ほんらい別のコマと解釈できる」もの、などがあります。 厳密には個々の対処が必要ですが、おおまかに言うならば、 1コマのうちで語られたものは、その文脈を崩して部分だけ参照したときに 誤解なく再利用できる知識である、という保証がありません。 このため、資料閲覧者の利益を考えると、1概要でひとまとめ、とするのが 適切であると考えます。 (関連性を保持して取り出せるのであれば、DB内の形式は問いません) また、もうひとつの考え方として、過去データはPDFごと管理を 基本とした対処でもしかたないかもしれませんが、 将来のイベント記録方式についての単位を明確にするためのポイントと して提案してもよいかと思います。 続けて読まなければ意味をなさないようなら1コマの範疇とし、 PDFも可能な限り1つにまとめる。 そして、独立した内容ならば別コマ別PDFに分ける、というような。 (当日の式次第ではオトナの事情で1コマ扱いだが 資料ページでは別コマというようなこともありそう) ---------------
なお、配布資料の必要部数把握のため、下記から申し込みフォームから送信(メール送信になります)、あるいは、あて先、SubjectをコピペしてWebメール等から送信をお願いします。