アンケート調査へのOMR活用

アンケート調査へのOMR活用
岡山商科大学経営学部
田中 潔
この報告の背景 いくつか
• スキャナをOMRとして利用することは聞いて
いた。認識ソフトを使う機会がなかった
• 学内出席採点開発の機会に恵まれた
– 認識ソフトを導入してみた
• ついでに社会調査に応用する機会
• 結果: 調査や出席採点には使える感触
アンケート調査のデータエントリー
•
•
•
•
•
•
表計算入力型…エクセルが代表、入力大変
機械エントリー型
今やOMR 光学式マークリーダー
OCR 光学式文字リーダー
さらにスマホやタッチペンによる漢字認識も
アンケートへのOCR、OMR利用
– 1990年代割と盛んに
今なぜOMRなのか?
• OMRの長所
– 認識性が単純であり、ラフ
• OMRの制約
– 精度向上には、専用用紙、インクを推奨
– 定型的フォーマットに向く
– 印刷会社に限定がある(例:小林記録紙)
• このため、原理の追求は行われたが、残念な
がら普及するには至らなかった
その後、認識装置 格段の進歩
• 特に、Desk Top OMR推進の原動力
• 1.安価、高速になったスキャナ
– 特に自動給紙タイプのハンディ型
– 電子書籍普及戸ともに、画像読み取りとして「自
炊」デバイスとして重宝
• 2.マーク識別ソフトの生き残り
– 大手メーカーは参入しないものの、それなりの小
さな市場を形成してきた
普通紙マークシートソフト
• 正一郎 IAC社 13万円
• Remark office OMR ハンモック社 16万円
• いずれも、
• OMR・バーコード認識
• エクセル風表計算
• 定型的な単純集計・統計機能
• 外部データへの変換
OMR読み取りまでの手順概要
•
•
•
•
•
•
1.Wordなどで回答用紙を作成する
2.読み取る項目を認識ソフトで指定する
3.回答用紙をスキャナで読み取り
画像ファイル化する
4.認識ソフトで認識する マーク→数値
5.エクセル風画面から数値データとして保存
– 各種ファイル化が可能
– またはコピペで移動させる
認識ソフトの出会い、なれそめ
• 2010・2011 学内出席システムの整備
• 主システムはWeb上で稼動学生証バーコー
ド→ハンディスキャナ認識
• 毎回小テストをとりたい要望
– 解決1 学籍番号バーコードシールを配布
– 解決2 別のおまけシステムの導入
• このとき認識ソフトRemark Officeを購入でき
た。この有効利用
学識番号認識の例
• こうして、出席システムへの適用は可能に
なった
• 学内幾つかの科目で利用される
• キャリアセンターなどの意見採集に応用
• そこで、アンケート調査の回答に適用できな
いか?との模索開始
アンケート調査の回答用紙に応用
記入例(一部)
回答用紙の認識項目の割当
(テンプレート作成)
画像ファイルからの認識
認識された素データ
認識できるマークパターン
Remark Officeの場合
•
•
•
•
•
•
•
•
Multiple 単一回答または複数回答
Grid
複数行(列)を一つの文字列
○●○
○○● “12”
Binary 0/1の文字列
○●●○ “0110”
その他、List、Add、Booleanなどもある
バーコードCODE39,Codebarも認識
若干の注意点
•
•
•
•
•
○●○●○○ 1と3にマークあり
認識させると“1,3”という文字列を返す
ちょうどエクセルの複数回答として認識
“010100”はbinaryで可能
0,1,0,1,0,0の数値としては返してくれない
• しかし、SPSSやExcelファイルなど多岐にわ
たるファイルに変換が可能
使用するマークのフォント
•
•
•
•
認識できるフォント
推奨: Arialの大文字O(オー)10-12ポイント
日本語○●①②・・・も問題なし
サイトから専用フォント①やAの○囲いなどが供給さ
れる
• 検索エンジン「OMRフォント」で検索
• Windowsマークシートフォントは大きくしてもうまく行
かなかった。今後の研究課題
岡山地域の印刷動向調査
2011への適用
目的: 岡山県下の企業を対象に、
社内での印刷や外注状況を知る
方法: 所定のアンケート用紙に
よる郵送留置き方法
回収: 郵送により返送(約1週
間)
対象: 岡山企業年報2011の企
業4,026社のうち無作為に抽出し
た600社
認識とは別に、事前に会社IDの設定
により、フェース部分の印刷
実施結果の評価・まとめ
• 回収した約200票は20分程度で読み取り出
来た
• 誤認識回収の訂正を含めても1時間以内で
素データが完成した
• A41ページの回答票に20問程度の回答が可
能だった
• 回答項目が増えても複数ページに分ければ
読み取りは可能
• 複数回答の設計に工夫が必要