scalaxb 0.4.0

proguard

恐らく Scala バージョンが合わなかったことに起因する sbaz を使った scalaxb インストールの問題が前に何例か報告されたので scala-library を sbt-proguard-plugin を使って scalaxb.jar の中に入れてしまうことにしました.

--class-prefix と --param-prefix

生成されるコードにプリフィックスを加えるため,--class-prefix と --param-prefix の二つのオプションを追加しました.主要なスキーマのように要素名に小文字を使っていればこのオプションは必要になることはないと思います.scalaxb はクラス名の語頭を大文字にしますが,パラメータ名はいじらないため,以下のようなコードになるためです:

case class USAddress(name: String,
  street: String,
  city: String,
  usstate: USState,
  zip: Int) extends Addressable

要素名の語頭がスキーマの中でも大文字化されているとすると,以下のようなコードになってしまいます:

case class USAddress(Name: String,
  Street: String,
  City: String,
  USState: USState,
  Zip: Int) extends Addressable

<choice> の限定

XML ドキュメントを利用しやすいネイティブなオブジェクトに変換(データ・バインディング)する,そしてそのオブジェクトを XML ドキュメントに逆変換(ラウンド・トリップ)できる能力を保持するという二つの要請から rt.DataRecord は 生まれました.しかし,この二つの要件は時として統一的な行動を取りません.例えば,逆変換のことだけを考えてしまうと,XML を書き出すために scala.xml.Node を保持すれば解決してしまいますが,データ・バインディングという立場から見ると便利なものではありません.

scalaxb の当初の目標は XML Schema の表現空間をカバーして,かつラウンド・トリップを実装することでした.この目標はほぼ達成されたので,最近の更新では逆変換性は保持しつつ,生成されたコードの利便性を高めることを目指してきました.ラウンド・トリップ側に傾き過ぎたものの一つに <choice> のコード生成があります.まずはこれまでの <choice> のコード生成の歴史を振り返り,最後に新しい案を提起したいと思います.

<any>,再び

<any> のラウンド・トリップにおいて貨物を無くさないために,DataRecord中に scala.xml.Elem を保存してきましたが,DataRecord を利用する側に立つと,これは不便でもあります.問題は <any> はどの要素が来てもいいためパース不可能なことです.ただし,組み込み型はパース可能です.

混在内容のカタがある程度ついたので,XSD 組み込み型のパースに手をつけるいい機会だと思いました.使用例は以下のようになります:

def testAny {
  val subject = <foo xmlns="http://www.example.com/any"
      xmlns:xs="http://www.w3.org/2001/XMLSchema"
      xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
        <int xsi:type="xs:int">1</int>
        <byte xsi:type="xs:byte">1</byte>
        <dateTime xsi:type="xs:dateTime">2002-10-10T12:00:00Z</dateTime>

混在内容,再び

混在内容のサポートを前に始めましたが,おさらいをしておくと,<xs:complexType mixed="true"> の時,XHTML のように一つの要素内にテキストノードと子要素が並列して混在することができようになります.実装した後で,生成される case class が DRY じゃないのが結構気になっていました.

例えば,

<xs:element name="mixedTest">
  <xs:complexType mixed="true">
    <xs:choice maxOccurs="unbounded">
      <xs:element name="billTo" type="Address"/>
      <xs:any namespace="##other" processContents="lax" />
    </xs:choice>
  </xs:complexType>
</xs:element>

scalaxb 0.3.0

Tuple22 限界への対策

今年の初めに Scala の限界に関して書きました:

Scala は Tuple22 までしかサポートしません.

これは Scala が 22個のパラメータを超えた case class を定義できないことを意味します.22個を超えたパーティクルを持つシーケンスを含む複合型を定義するスキーマを扱えるよう回避策をいくつか用意しました.

まず,シーケンスが MaxParticleSize (20)個以上のパーティクルを持つとき,シーケンスを ChunkParticleSize (10)個ごとのチャンク(塊)に分けることにしました.例えば,30個の要素を持つシーケンスは 10個づつの要素を持った三つのチャンクに分かれます:

<xs:element name="foo">
  <xs:complexType>
   <xs:sequence>
     <xs:element name="string1" type="xs:string"/>
     <xs:element name="string2" type="xs:string"/>

代替グループ

XML Schema Part 0: Primer:

XML Schema には特定の要素を他の要素に差し替える代替グループという機構を持つ.具体的には,ヘッド要素と呼ばれる特定の要素に代替可能な特別な要素グループに他の要素を割り当てることができる.(ただし,ヘッド要素と代替可能な要素はグローバル要素に限る)

以下に代替グループの例を示します:

<complexType name="GH6Usage">
  <sequence>
    <element ref="ipo:gh6head"/>
    <element name="gh6head2" type="string" />
    <element name="city"   type="string"/>
  </sequence>
</complexType>

<element name="gh6head" type="string" abstract="true"/>

<enumeration>

XML Schema Part 0: Primer より:

enumeration (列挙)ファセットは単純型を具体的な値の集合へと限定します.例えば,アメリカの州の略称を値とする USState という新しい単純型をstringから派生して定義するのに enumeration ファセットを利用することができます:

<xsd:simpleType name="USState">
  <xsd:restriction base="xsd:string">
    <xsd:enumeration value="AK"/>
    <xsd:enumeration value="AL"/>
    <xsd:enumeration value="AR"/>
    <!-- and so on ... -->
  </xsd:restriction>
</xsd:simpleType>

このような制限は case object を使って表現することができます.以下は scalaxb が生成するコードです:

trait USState
 
object USState {
Syndicate content