◆◇◆ ライセンス ◆◇◆

- 我々とは神嶌敏弘，その共同研究者，および彼らの雇用者をさします
- あなた方とはこのデータの使用者，その共同研究者，および彼らの雇用者をさします
- 我々は，あなた方のこのデータの利用，もしくはその利用不可に起因もしくは関連した，いかなる損害や損失に対しても責任を負いません
- あなた方はこのデータを研究目的に利用できます
- あなた方は，我々の許可無くこのデータを再配布することはできません
- できれば，あなた方は，このデータの利用から得た結果を発表する場合は，我々の発表を引用することで，このデータを利用したことを示して下さい．

◆◇◆ ファイル構成 ◆◇◆

README-ja.txt         README (日本語)
README-en.txt         README (英語)
README-stat-ja.txt    データの統計量 (日本語)

sushi3.idata          アイテムの特徴
sushi3.udata          利用者の特徴

sushi3a.5000.10.order アイテム集合 A に対する嗜好順序
                      文献[1]4.1節のステップ1で順位法で獲得
sushi3b.5000.10.order アイテム集合 B に対する嗜好順序
                      文献[1]4.1節のステップ5で順位法で獲得
sushi3b.5000.10.score アイテム集合 B に対する評価値
                      文献[1]4.1節のステップ2で採点法で獲得

[1] T. Kamishima, "Nantonac Collaborative Filtering: Recommendation Based on Order Responses", KDD2003, pp.583-588 (2003)

◆◇◆ アイテムID ◆◇◆

*** アイテム集合AのID

0:えび      1:穴子      2:まぐろ    3:いか      4:うに
5:いくら    6:玉子      7:とろ      8:鉄火巻    9:かっぱ巻  

*** アイテム集合BのID

 0:えび          1:穴子          2:まぐろ        3:いか          4:うに        
 5:たこ          6:いくら        7:玉子          8:とろ          9:甘えび      
10:ほたて貝     11:たい         12:赤貝         13:はまち       14:あわび      
15:サーモン     16:数の子       17:しゃこ       18:さば         19:中とろ      
20:ひらめ       21:あじ         22:かに         23:こはだ       24:とり貝      
25:うなぎ       26:鉄火巻       27:かんぱち     28:みる貝       29:かっぱ巻    
30:げそ         31:かつお       32:いわし       33:ほっき貝     34:しま鯵      
35:かにみそ     36:えんがわ     37:ねぎとろ     38:納豆巻       39:さより      
40:たくわん巻   41:ぼたんえび   42:とびこ       43:いなりずし   44:めんたいこ  
45:サラダ       46:すずき       47:たらば蟹     48:梅しそ巻     49:子持ちこんぶ
50:たらこ       51:さざえ       52:あおやぎ     53:とろサーモン 54:さんま      
55:はも         56:なす         57:白魚         58:なっとう     59:あんきも    
60:かんぴょう巻 61:ねぎとろ巻   62:牛さし       63:はまぐり     64:馬さし      
65:ふぐ         66:つぶ貝       67:穴きゅう巻   68:ひら貝       69:おくら      
70:梅巻         71:サラダ巻     72:めんたいこ巻 73:ぶり         74:しそ巻      
75:いか納豆     76:づけ         77:ひも         78:貝割れ       79:くるまえび  
80:めかぶ       81:くえ         82:さわら       83:ささみ       84:くじら      
85:かも         86:ひもきゅう巻 87:とびうお     88:いしがきだい 89:ままかり    
90:ほや         91:バッテラ     92:キャビア     93:からすみ     94:うにくらげ  
95:かれい       96:ひらまさ     97:なまこ       98:ししゃも     99:かき        

◆◇◆ sushi3a.5000.10.order / sushi3b.5000.10.order ◆◇◆

それぞれ，アイテム集合A と B に対する嗜好を利用者に順位法で質問した結果

- 先頭のヘッダ行
 <アイテムの総数 |X*|><sp>1<nl>

|X*| は，sushi3a.5000.10.order では10，sushi3b.5000.10.order では100

- 本体以降
各行が sushi3.udata の各行の利用者に対応
 0<sp><順序長 |Xi|><sp><1番目のアイテムID>....<|Xi|番目のアイテムID><nl>

アイテムは最も好きなものから順に整列

<sp>:空白(0x20)
<nl>:改行(0x0a)

◆◇◆ sushi3b.5000.10.score ◆◇◆

- <sp>区切りの表形式データ
- 各行が sushi3.udata の各行の利用者に対応
- 各列がアイテム集合Bのアイテムに対応
- 評価値は5段階．0が嫌い，4が好き，-1 は未評価を示す．

警告：2015年12月29日より以前にダウンロードしたファイルにはバグがあります．4が好きと表記してありますが，実際には0が好きになっていました．

◆◇◆ sushi3.idata ◆◇◆

TAB区切りテキスト

各列の内容 
1. アイテムID
2. 名前 (日本語，UTF-8)
3. スタイル1    0:巻き      1:それ以外
4. 大分類       0:魚介類    1:それ以外
5. 小分類       0:青物      1:赤身      2:白身      3:タレ      
                4:貝        5:イカたこ  6:海老カニ  7:魚卵
                8:他魚介    9:鶏卵      10:魚以外肉 11:野菜     
6. こってり度 [0-4] 0:こってり
7. 食べる頻度 [0-3] 3:良く食べる
8. 正規化した価格
9. 販売頻度   [0-1] 1:高頻度

※ 特徴3-5はカテゴリ特徴，特徴6-9は数値特徴
※ 特徴6と7は被験者へのSD法による質問の平均結果
※ 特徴8と9は25件のWEB上のメニューを調査した結果

・特徴8の価格の正規化方法
  各店ごとに，にぎりと巻きにわける
  最も安いにぎりと巻きをみつけ，その価格で他のにぎりや巻きの価格を正規化
  25軒の店のなかで，同じ種類の寿司について正規化した価格の平均を計算

フィールドはTAB区切り

◆◇◆ sushi2.idata ◆◇◆
各列の内容 
1. ID番号
2. 名前
3. スタイル1    0:巻き      1:それ以外
4. 大分類       0:魚介類    1:それ以外
5. 小分類       0:青物      1:赤身      2:白身      3:タレ      
                4:貝        5:イカたこ  6:海老カニ  7:魚卵
                8:他魚介    9:鶏卵      10:魚以外肉 11:野菜     
6. こってり度 [0-4] 0:こってり
7. 食べる頻度 [0-3] 3:良く食べる
8. 正規化した価格
9. 販売頻度   [0-1] 1:高頻度

※ 属性3-5はカテゴリ属性，属性6-9は数値属性
※ 属性6と7は被験者へのSD法による質問の平均結果
※ 属性8と9は25件のWEB上のメニューを調査した結果

・属性8の価格の正規化方法
  各店ごとに，にぎりと巻きにわける
  最も安いにぎりと巻きをみつけ，その価格で他のにぎりや巻きの価格を正規化
  25軒の店のなかで，同じ種類の寿司について正規化した価格の平均を計算

◆◇◆ sushi2.udata ◆◇◆

フィールドはTAB区切り

各列の内容 
1   利用者ID
2   性別    0:男性 1:女性
3   年齢    0:19以下   1:20代    2:30代    3:40代    4:50代    5:60以上
4   回答時間(秒)
5   15歳までに最も長く住んだ県番号
6   15歳までに最も長く住んだ地域番号
7   15歳までに最も長く住んだ東西番号
8   現在住んでいる県番号
9   現在住んでいる地域番号
10  現在住んでいる東西番号
11  5と8が一致すれば 0，違えば 1

※ 著者のレコード
323 : 神嶌 敏弘
617 : 赤穂 昭太郎
1431: 賀沢 秀人
4667: 藤木 淳
残りは匿名です．レコード番号は1から始まります．

※ 県番号
 0:北海道    1:青森県    2:岩手県    3:秋田県    4:宮城県
 5:山形県    6:福島県    7:新潟県    8:茨城県    9:栃木県
10:群馬県   11:埼玉県   12:千葉県   13:東京都   14:神奈川県
15:山梨県   16:静岡県   17:長野県   18:愛知県   19:岐阜県
20:富山県   21:石川県   22:福井県   23:滋賀県   24:三重県
25:京都府   26:大阪府   27:奈良県   28:和歌山県 29:兵庫県
30:岡山県   31:広島県   32:鳥取県   33:島根県   34:山口県
35:愛媛県   36:香川県   37:徳島県   38:高知県   39:福岡県
40:長崎県   41:佐賀県   42:熊本県   43:鹿児島県 44:宮崎県
45:大分県   46:沖縄県   47:海外

※ 地域番号
 0:北海道       北海道
 1:東北         青森, 岩手, 秋田, 宮城, 山形, 福島
 2:北陸         新潟, 富山, 石川, 福井
 3:関東+静岡    茨城, 栃木, 群馬, 埼玉, 千葉, 東京, 神奈川, 静岡
 4:長野+山梨    山梨, 長野
 5:中京         愛知, 岐阜, 三重
 6:近畿         滋賀, 京都, 大阪, 奈良, 和歌山, 兵庫
 7:中国         岡山, 広島, 鳥取, 島根, 山口
 8:四国         愛媛, 香川, 徳島, 高知
 9:九州         福岡, 長崎, 佐賀, 熊本, 鹿児島, 宮崎, 大分
10:沖縄         沖縄
11:海外         海外

※ 東西番号
 0: 地域番号が5以下                 1: 地域番号が6以上
