光学式マーク認識

ウィキペディアから、無料の百科事典
ナビゲーションにジャンプ 検索にジャンプ

光学式マーク認識(光学式マーク読み取りおよびOMRとも呼ばれます)は、人々が調査テスト、およびその他の紙の文書 にマークを付ける情報を読み取るプロセスです。

OMRは、質問票、影付きの領域の形式の多肢選択式試験問題読むために使用されます。

OMRの背景

専用のOMRデバイスでスキャンするように設計された、レジストレーションマークとドロップアウトカラーを備えたOMRテストフォーム

多くのOMRデバイスには、フォームに光を当てるスキャナーがあります。次に、デバイスは、フォーム上の特定の位置での光の対照的な反射率を調べます。フォームの空白領域よりも反射する光が少ないため、ブラックマークが検出されます。

一部のOMRデバイスは、経光学紙に印刷されたフォームを使用します。その後、デバイスは紙を通過する光の量を測定できます。通過する光の量を減らすため、用紙の両側にある黒いマークを拾います。

専用のOMRデバイスとは対照的に、デスクトップOMRソフトウェアを使用すると、ユーザーはワードプロセッサまたはコンピュータで独自のフォームを作成し、レーザーレーザープリンタで印刷できます。次に、OMRソフトウェアは、ドキュメントフィーダーを備えた一般的なデスクトップイメージスキャナーと連携して、入力されたフォームを処理します。

OMRは、複雑なパターン認識エンジンが必要ないという事実によって、一般に光学式文字認識(OCR)と区別されます。つまり、マークは、OMRデバイスが正しく読み取れない可能性がほとんどないように構成されています。これには、画像のコントラストが高く、認識しやすい、または無関係な形状である必要があります。OMRおよびOCRに関連するフィールドは、製品パッケージに あるUPCバーコードなどのバーコードの認識です。

OMRの最もよく知られているアプリケーションの1つは、多肢選択問題の試験で#2鉛筆(ヨーロッパではHB)のバブル光学式解答用紙を使用することです。生徒は、フォームの円を暗くして、回答やその他の個人情報にマークを付けます。次に、シートは走査機によって等級分けされます。

  • 米国およびほとんどヨーロッパ諸国では、長方形の「トローチ」の水平または垂直の「目盛り」が最も一般的に使用されるタイプのOMRフォームです。
  • 英国で最もよく知られている形式は、英国国営宝くじの形式です。[要出典]

トローチマークは、マークを付けやすく、消去しやすい後のテクノロジーを表しています。大きな「バブル」マークは、非常に初期のOMRマシンのレガシー技術であり、信頼性のために大きなマークが必要でした。ほとんどのアジア諸国では、特別なマーカーが光学解答用紙に記入するために使用されます。同様に、生徒は、事前に印刷されたシートにマークされた円を暗くすることによって、回答またはその他の情報をマークします。次に、シートはスキャンマシンによって自動的にグレーディングされます。

今日のOMRアプリケーションの多くは、特殊なフォームに記入する人々を含みます。これらのフォームは、コンピュータースキャン用に最適化されており、印刷に注意深く登録し、あいまいさを最小限に抑えるように注意深く設計しています。エラー率が非常に低く、コストが低く、使いやすいため、OMRは投票を集計するための一般的な方法です。[1] [2] [3] [4] [5] [6] [7] [8] [9] [10]

印刷物にもOMRマークが付いているので、フォルダーインサーター装置が使えます。マークは、メールドキュメントの各(通常向き/奇数)ページに追加され、メールを折りたたんで封筒に挿入するタイミングを決定するために、フォルダ挿入装置がスキャンする一連の黒いダッシュで構成されます。

光学解答用紙

光学解答用紙に記されたSAT数学の質問への回答

光学式解答用紙またはバブルシートは、多肢選択問題の試験で使用される特殊なタイプのフォームです。OMRは回答を検出するために使用されます。Scantron Corporationは多くの光学解答用紙を作成していますが、特定の用途では独自のカスタマイズされたシステムが必要です。[要出典]

光学解答用紙には通常、各質問に対応する一連の空白の楕円またはボックスがあり、多くの場合、別々の紙に書かれています。バーコードはシートに自動処理のマークを付ける場合があり、塗りつぶされた一連の楕円は、読み取られると特定の値を返します。このようにして、生徒の回答をデジタルで記録したり、身元を明かしたりすることができます。

読書

最初の光学解答用紙は、シートを通して光を当て、反対側の光電管を使用してどのくらいの光が遮られたかを測定することによって読み取られました。[11]一部の光電管は可視スペクトルの青色の端にほとんど敏感であるため[12]青色のインクは青色の光を反射および透過するため、青色のペンは使用できませんでした。このため、泡を埋めるために2番の鉛筆を使用する必要がありました。グラファイトは非常に不透明な物質であり、それに当たる光のほとんどを吸収または反射します。[11]

現代の光学解答用紙は、反射光に基づいて読み取られ、明暗を測定します。2番の鉛筆で塗りつぶす必要はありませんが、他のタイプよりも推奨されます(これは、2番の鉛筆のマークが薄く、1番の鉛筆の汚れが原因です)。多くのシステムはフォームが印刷されたのと同じ色のマークを無視しますが、黒インクが読み取られます。[11]これにより、反対側に付けられたマークが反射率の読み取りに干渉しないため、光学解答用紙を両面にすることもできます。不透明度の測定値と同じくらい。

ほとんどのシステムは、楕円を不正確に埋める際の人為的エラーに対応します。他の楕円に迷わず、楕円がほぼ埋められている限り、スキャナーはそれを埋められたものとして検出します。

エラー

光学式解答用紙が正しく印刷されず、すべての楕円が塗りつぶされた状態で読み取られる可能性があります。これは、楕円の輪郭が太すぎるか、不規則な場合に発生します。2008年の米国大統領選挙中に、これジョージア州グイネット郡で19,000を超える不在者投票で発生し、約10,000がすでに返還された後に発見されました。わずかな違いは肉眼では明らかではなく、10月下旬に試運転が行われるまで検出されませんでした。これには、すべての投票用紙を隔離して正しく印刷された投票用紙に転送する必要がありました

OMRソフトウェア

画像スキャナーとOMRソフトウェアでスキャンするように設計された、登録マークとドロップアウトカラーのない普通紙のOMR調査フォーム

OMRソフトウェアは、イメージスキャナーを使用して、レーザープリンターで印刷された調査、テスト、出席シート、チェックリスト、およびその他の普通紙のフォームを処理する ことにより、デスクトップコンピューターでOMRを可能にするコンピューターソフトウェアアプリケーションです。

OMRソフトウェアは、OMRシートからデータをキャプチャするために使用されます。データキャプチャスキャンデバイスは、OMRシートの用紙サイズやデザインパターンなどの多くの要因に焦点を当てています。

市販のOMRソフトウェア

一般的な画像スキャナーからの画像を使用した最初のOMRソフトウェアパッケージの1つは、Gravic、Inc。(元々はPrincipia Products、Inc。という名前)によって作成されたRemark OfficeOMRでした。Remark Office OMR1.0は1991年にリリースされました。

OMRソフトウェアの必要性は、初期の光学式マーク認識システムが専用のスキャナーと、ドロップアウトカラーとレジストレーションマークを備えた特別な印刷済みフォームを使用していたために発生しました。このようなフォームは通常、1ページあたり0.10ドルから0.19ドルかかります。[13]対照的に、OMRソフトウェアユーザーは、ワードプロセッサまたは組み込みのフォームエディタを使用して独自のマークセンスフォームを設計し、それらをプリンタでローカルに印刷し、多数のフォームで数千ドルを節約できます。[14]

国勢調査フォームの処理など、フォーム内の光学マークの識別は、1980年代後半から、多くのフォーム処理(Batch Transaction Capture)企業によって提供されてきました。ほとんどの場合、これは、白黒画像(bitonal)に変換すると正当なマークのように見える汚れた消しゴムで消去されたものなど、無関係なマークを排除するための最小および最大ピクセル数のビット画像とピクセル数に基づいています。したがって、この方法は、ユーザーが気が変わったときに問題を引き起こす可能性があります。そのため、一部の製品は、マーカーの意図をより適切に識別するためにグレースケールを使用し始めました。内部では、スキャントロンおよびNCSスキャナーはグレースケールを使用していました。

OMR開発ライブラリ

会社 製品 設立年
ABBYY ABBYY FineReader Engine 1993年
Accusoft FormFix 1991
仮定する .NET OMRリーダーおよびパーサー 2001年
GDPicture .NETOMRおよびテンプレート認識SDK 2003年
LEAD Technologies LEADTOOLS 1990年
VintaSoft FormsProcessing.NETプラグイン 2001年

オープンソースOMRソフトウェア

無料またはオープンソースライセンスの下で開発および配布された一部のOMRソフトウェア:

OMRソフトウェアのリスト
名前 クリエイター ノート 最新の安定バージョン 費用(US $ ソフトウェアライセンス オープンソース
FormScanner アルベルトボルセッタ マルチプラットフォームJavaアプリケーション、カスタムフォームをサポート 2017-06-07 無料 GPLv3 はい
queXF 組み込まれた社会的および政治的研究のためのオーストラリアのコンソーシアム 単独で使用することも、 LimeSurveyからエクスポートされた調査と組み合わせて使用​​することもできます 2019-05-13 無料 GPLv2 はい
ウダイOMR アーディテシュワールセス 2007年 無料 GPLv2 はい
共有アンケートシステム(SQS) 2016年 無料 Apacheライセンスv2.0 はい
自動複数選択 AlexisBienvenüe クラステスト用、LaTeXフォーマット 2018-12-29 無料 GPLv2 はい
MoodleクイズOMR OMRシートで実施されるオフラインクイズのオンラインサポート 無料 GPLv3 はい
SDAPS:紙ベースの調査によるデータ取得のためのスクリプト ベンジャミンバーグ 調査用、LaTeXおよびODT形式のドキュメントをサポート 2019-06-02 無料 GPLv3 はい
OMRマークエンジン C#実装は、カスタムフォームを使用した一括スキャンをサポートします 2015年 無料 Apacheライセンスv2.0 はい
G'n'T Eval Stefan Breunig 2013年 無料 ISCライセンス はい

歴史

光学式マーク認識(OMR)は、紙をスキャンして、所定の位置にあるマークの有無を検出することです。[4]光学式マーク認識は、他のいくつかの技術から進化してきました。19世紀初頭と20世紀には、視覚障害者を支援する機械の特許が付与されました。[2]

OMRは現在、データ入力の入力デバイスとして使用されています。OMRの初期の2つの形式は、紙テープパンチカードで、媒体に鉛筆で塗りつぶされた円の代わりに、媒体に実際に開けられた穴を使用します。紙テープは、早くも1857年に電信の入力デバイスとして使用されていました。[10]パンチカードは1890年に作成され、コンピューターの入力デバイスとして使用されました。1970年代初頭、パソコンの登場によりパンチカードの使用は大幅に減少しました。[8]バブルで満たされた鉛筆の存在が認識される最新のOMRでは、認識は光学スキャナーを介して行われます。

最初のマークセンススキャナーはIBM805 Test ScoringMachineでした。これは、ページをスキャンしたワイヤーブラシのペアを使用して、グラファイト鉛筆の芯の電気伝導率を感知することによってマークを読み取ります。1930年代に、IBMのRichard Warrenは、米国特許2,150,256(1932年に提出、1939年に付与)および2,010,653(1933年に提出、1935年に付与)に記載されているように、テストスコアリング用の光学式マークセンスシステムを実験しました。最初に成功した光学式マークセンススキャナーは、エベレットフランクリンリンドクイストによって開発されました米国特許3,050,248(1955年に出願、1962年に付与)に記載されています。Lindquistは、多数の標準化された教育テストを開発し、当時の標準のIBM 805よりも優れたテストスコアリングマシンを必要としていました。Lindquistの特許の権利は、アイオワ大学がWestinghouseCorporationに事業を売却した1968年までMeasurementResearchCenterによって保持されていました

同じ時期に、IBMは、米国特許第2,944,734号(1957年に出願、1960年に付与)に記載されているように、成功した光学マークセンステストスコアリングマシンも開発しました。IBMは、これを1962年にIBM 1230光学式マークスコアリングリーダーとして商品化しました。これとさまざまな関連マシンにより、IBMは、マークセンスマシン用に開発されたさまざまなアプリケーションを新しい光学技術に移行できました。これらのアプリケーションには、さまざまな在庫管理およびトラブル報告フォームが含まれ、そのほとんどは標準のパンチカードの寸法でした。

教育試験分野の他のプレーヤーはスキャンサービスの販売に焦点を合わせていましたが、1972年に設立されたScantronCorporation [15]は別のモデルを持っていました。安価なスキャナーを学校に配布し、テストフォームの販売から利益を得るでしょう。その結果、多くの人々が、すべてのマークセンス形式(光学的に検出されているかどうかに関係なく)をスキャントロン形式と考えるようになりました。

1983年、Westinghouse LearningCorporationはNationalComputer Systems(NCS)に買収されました。2000年に、NCSはピアソンエデュケーションに買収されました。ピアソンエデュケーションでは、OMRテクノロジーがピアソンのデータ管理グループの中核を形成しました。2008年2月、M&Fワールドワイドはピアソンからデータ管理グループを購入しました。このグループは現在、Scantronブランドの一部です。[16]

OMRは、以下に示すように多くの状況で使用されてきました。在庫システムでのOMRの使用は、パンチカードとバーコードの間の移行であり、この目的にはあまり使用されていません。[8] OMRは、調査やテストに広く使用されています。

使用法

OMRの使用は、学校やデータ収集機関に限定されません。多くの企業や医療機関は、OMRを使用してデータ入力プロセスを合理化し、入力エラーを減らしています。OMR、OCR、およびICRテクノロジーはすべて、紙のフォームからデータを収集する手段を提供します。OMRは、OMR(ディスクリートリードヘッド)スキャナーまたはイメージングスキャナーを使用して実行することもできます。[17]

アプリケーション

日本中央競馬会 福島競馬場で使用されているOMRベッティングフォーム
このフォームを使用してチケットを賭けます。

たとえば、OMRには他にも多くのアプリケーションがあります。

フィールドタイプ

OMRには、質問者が望む形式を提供するためのさまざまなフィールドがあります。これらのフィールドは次のとおりです。

  • 複数。複数のオプションがありますが、1つだけが選択されます。たとえば、フォームはオプションABCDEの1つを要求する場合があります。12345; 完全に同意しない、同意しない、無関心、同意する、完全に同意する。または類似。
  • グリッド:バブルまたはラインは、ユーザーが電話番号、名前、ID番号などを入力できるようにグリッド形式で設定されます。
  • 追加し、回答を1つの値に合計します
  • ブール値、該当するものすべてに「はい」または「いいえ」と答える
  • バイナリ、1つだけに「はい」または「いいえ」と答える
  • Smartshoot OMRによって開発された点線フィールドにより、従来のカラードロップのようにボーダードロップが可能になります。

機能/要件

過去および現在、一部のOMRシステムには、特殊な紙、特殊なインク、および特殊な入力リーダーが必要です(Bergeron、1998)。これにより、質問できる質問の種類が制限され、フォームの入力時に大きな変動が発生することはありません。OMRの進歩により、ユーザーは独自のフォームを作成して印刷し、スキャナー(できればドキュメントフィーダー付き)を使用して情報を読み取ることができるようになりました。[18]ユーザーは、データを簡単に入力しながら、ニーズに合った形式で質問を整理することができます。[19] OMRシステムは100%の精度に近づき、マークを認識するのに平均5ミリ秒しかかかりません。[18]ユーザーは、マークゾーンに正方形、円、楕円、六角形を使用できます。次に、ソフトウェアは、塗りつぶされたバブル、クロス、またはチェックマークを認識するように設定できます。

OMRは個人的な使用にも使用できます。市場にはオールインワンプリンターがあり、印刷されたインデックスシートにサイズと用紙を選択するためのバブルを埋めることで、ユーザーが選択した写真を印刷します。シートが記入されると、個人はスキャンされるスキャナーにシートを置き、プリンターは示されたマークに従って写真を印刷します。[要出典]

短所

OMRにはいくつかの欠点と制限もあります。ユーザーが大量のテキストを収集したい場合、OMRはデータ収集を複雑にします。[20]スキャンプロセスでデータが欠落する可能性もあり、ページが正しくないか番号が付けられていないと、間違った順序でスキャンされる可能性があります。また、セーフガードが設定されていない限り、ページが再スキャンされ、重複データが提供され、データが歪む可能性があります。[18]

OMRの普及と使いやすさの結果として、標準化された試験は主に多肢選択式の質問で構成され、テスト対象の性質が変化します。

も参照してください

リスト

参考文献

  1. ^ 「光学式マーク認識」2006年6月13日にオリジナルからアーカイブされました2006年6月13日取得
  2. ^ ab リサーチプティカル文字認識| マクミラン科学図書館:コンピュータサイエンスBookrags.com。2010-11-02 2015年7月3日取得
  3. ^ 「光学スキャンシステム—」Aceproject.org 2015年7月3日取得
  4. ^ a b Haag、S.、Cummings、M.、McCubbrey、D.、Pinsonnault、A.、Donovan、R。(2006)情報時代の経営情報システム(第3版)。カナダ:McGraw-Hill Ryerson
  5. ^ 「統計家のLib:手頃なデータ入力のためのスキャナーとOMRソフトウェアの使用」2005年11月10日にオリジナルからアーカイブされました2006年6月13日取得
  6. ^ 「安いデータ収集」2015年7月。2015年7月22日のオリジナル(PPT)からアーカイブ2015年7月21日取得
  7. ^ 「Gravic(Principia Products)によるRemark Office OMRは、一般的な画像スキャナーと連携して、調査、テスト、その他の普通紙のフォームをスキャンします」Omrsolutions.com 2015年7月3日取得
  8. ^ a b c Palmer、Roger C.(1989年9月)自動識別の基本[電子版]。Canadian Datasystems、21(9)、30-33
  9. ^ 「フォーム処理技術」Tkvision.com。2008年5月11日にオリジナルからアーカイブされました2015年7月3日取得
  10. ^ ab 研究 入力デバイス| マクミラン科学図書館:コンピュータサイエンスBookrags.com。2010-11-02 2015年7月3日取得
  11. ^ a b c Bloomfield、Louis A. 「質問1529:スキャントロンタイプのテストで#2の鉛筆しか読み取れないのはなぜですか?他の鉛筆でも機能しますか?」HowEverythingWorks.org。
  12. ^ Mullardテクニカルハンドブック第4巻セクション4:光電子放出セル(1960年版)
  13. ^ 「アーカイブされたコピー」(PDF)2009年3月20日にオリジナル(PDF)からアーカイブされました2009年3月12日取得 {{cite web}}:CS1 maint:タイトルとしてアーカイブされたコピー(リンク
  14. ^ マイケルワーゲンハイム。「大規模な州立大学での生物学試験の採点」RemarkSoftware.com 2015年7月21日取得
  15. ^ 「教育テストのための市場」Bc.edu 2015年7月3日取得
  16. ^ 「NCSPearson、Inc」2010年6月14日にオリジナルからアーカイブされました2010年6月14日取得
  17. ^ http://datamanagement.scantron.com/pdf/icr-ocr-omr.pdf [リンク切れ]
  18. ^ a b c バージェロン、[誰?]
  19. ^ LoPresti、1996 [誰?]
  20. ^ グリーン、2000 [誰?]