まとめ

データベースで扱うデータ型の中で最も多用されるのは文字列や数値でしょう。効率的にデータを格納するには、データ型の選択が重要になります。まさに、チリも積もれば山となる、です。

型の選択には特に厳密なルールはありませんが、例えば、以下のような優先順序で文字列型を選ぶような基準を作ってみてはいかがでしょうか:

1. 一定数の候補から選択では、整数型, 列挙型, "char" を使う。
都道府県名など候補が決まっている場合には、文字列ではなくIDとして格納すると効率的です。
2. 文字として数値しか表れないのであれば、整数型を使う。
ゼロ詰めしたい場合には、取得時に to_char() で書式を整えます。
3. 200文字以内ならば varchar 型
比較的短い文字列であることをスキーマ内で表明し、管理性や外部ツールとの連携性を高めます。ここでの「200文字」は特に根拠のある値ではありませんが、「設定上限を超える入力はありえない」と考えられる場合には「短い」と解釈できます。例えば、「人名」であれば 200 文字は十分ですが、「自己紹介」であれば上限は予想できないので短くないと扱って良いかと思います。
4. それ以外は text 型
長い文字列ならば、特に文字数を制限する必要も無いので text 型を使います。

お知らせ

EBM総合研究所は、EBMデータを製薬メーカー様へご提供する予定です。全ての臨床情報を有用な新薬開発の為に、、、