「ザバンイー」データエントリーシステム ■日本語データ・エントリー業務の既存問題を解消する ■最新技術の活用により生産性を求めて品質確保上のコストダウンが実現する ■システム開発会社が総合管理することで高品質業務を提供する 大連ビジネスサポートセンター 大連市沙河口区如意街24号C座2104室 TEL:0411-3964-7600 FAX:0411-3964-7680 E-mail: [email protected] 大連データエントリー分野の特徴 ピーク性 ― ピーク性が高いためピーク時に対応する要員を常時確保しておくことは不可能。ピーク時の 仕事量に応じて一挙に人集めを行わざるを得ない。中国では日本のデータエントリーに対応するため 日本語の分かる人員を一挙に集める必要があるが実際には不可能である。 従って日本側でピーク時にはあまり人員の選択は出来ない。 ― 以上の状況において例え人集めが出来たとしても品質確保は不可能に近い。 ― しかもデータエントリーでは、一般に納期は短期間であるため以上の問題点は更に加速される。 スケジュール管理 ― コスト安を狙って大規模なデータ入力業務を中国に出そうと考えるとスケジュール管理上多くの 問題が起こる。中国のデータエントリー会社は専門会社が多いためシステム開発の経験を持っている 会社は少ない。このような会社ではシステム開発のようなきちんとしたスケジュール管理は出来ない。 システム開発でさえスケジュール管理の問題が指摘されている中国では、データエントリー 分野だけに特化している専門会社ではスケジュール管理を前提にしたような大規模データエントリー 業務は受けられない。 ― 中国では、とにかく契約を取ってしまえば何とかなる、問題が起こってから解決すれば良いという考え方の 会社がシステム開発の会社でさえ多い。増してデータエントリーの分野では最初からスケジュール管理上 の問題点を理解さえしていないような会社が多い。これらを日本の会社側が商談だけで判別するのは 不可能に近い。 大連のデータエントリー会社の特徴 データエントリーの会社 ― 一般に中国のデータエントリーは専門会社が実施しておりシステム開発の経験は無い。 従ってデータエントリー分野へのシステム利用とかセキュリティソフトの開発などは出来ない。 また継続的生産性向上などの方策は不可能。 ― プロジェクト管理などの経験はなくスケジュール管理などはしたことが無い会社がほとんど。 従って大規模なデータエントリーの実行は難しい。 ― 大連においては、システム開発のように高賃金での採用と違いデータエントリー単独では日本語が分かって スキルも高いというような要員の確保は不可能。 ― ハード、ソフトなどという議論は出来ない。 要員 ― 日本語のデータ入力なので当然日本語の分かる要員が大量に必要になるが、コスト安での確保は 不可能に近い。日本語トレーニングが必要になるが、コストを考えると長期間の教育は不可能。 データエントリーだけでの日本語の分かる要員の確保では高いレベルの人員は集められない。 ― このような環境では短期間に要求されるような量に対応できない。 「ザバンイー」システムについて 最先端技術の活用により分業化して生産性を徹底的に向上させる ― 原稿レイアウトの自動解析機能 自社有力画像解析プログラムの活用で文章の画像を自動解析し、文字領域を抽出する。 この手法により業務フローとエントリー作業を分離させ、生産性を求める。 漢字や仮名と分類し、さらに同じ文字をソートして、作業の分業化により生産性を徹底的に高める。 ― 完璧なセキュリティ策 文章の内容により単語まで画像を自動分割し入力項目を決定する。 単独の入力画像断片をデータベースに登録して入力作業で参照する。 さらに入力の内容(漢字、かな、英数字など)を分類して、作業効率を求める。 入力項目と入力項目間のリンク関係は暗号化して別に保管する。 ― 入力作業の進行 入力作業はWEBサイトで行い、スケジュールなどの作業マネジメントはすべてシステムで行う。 日中間は同じ漢字文化圏の良さを生かして、日本の漢字は中国人としてピンインで入力可能にする。 日本語の分からない普通の人でもいつでも作業ができるようになる。 ― 品質管理 オペレータにより2回入力された文字列はすべてサーバ側のデータベースで管理し、入力された内容は Levenshtein Distanceアルゴリズムを活用して評価し、さらに再入力の管理により正確度を徹底的に求める。 テストケースでは99.98%の品質を達成しておる。 ― 成果物の出力機能 システムで入力された断片的な文字を回収してサーバ側で最終文章に復元する。 お客さんのニーズに合わせ、様々な納品データのフォーマットは自由に設定可能にする。 「ザバンイー」システムについて 註1:ザバンイーの漢字入力法 オペレータのエントリー作業はJAPANESE-CHINESE言語の概念を基にピンインで入力する。 JAPANESE-CHINESE言語というのは 漢字は日本語の漢字をそのまま表記し、中国語のピンインで入力する。 漢字以外の文字はそのままにしてローマ字で入力する。 注2:品質管理に編集距離 (Levenshtein Distance) アルゴリズム採用 最長共通部分列問題 (LCS)について編集距離のアルゴリズムがあります。 編集距離 (レーベンシュタイン距離, Levenshtein Distance) は二つの文字列の類似度 (異なり具合) を定量化する ための数値です。 編集距離はスペルミスを修正するプログラムや、近似文字列照合 (検索対象の文書から入力文字にある程度近い部分 文字列を探し出す全文検索) などで利用されます。 LCS長は"最長"共通部分系列の計算、編集距離は"最小"の手順回数の計算です。 いずれも最大もしくは最小つまり最適解を求める問題で、ある問題がその部分問題の最適解によって 計算できるという点で共通しています。 このような特性を部分問題最適性と言います。部分問題最適性を持つ問題はその部分問題の重複度合いが高い、 つまり何度も同じ部分問題の最適化を参照するような場合に DP が有効です。 「ザバンイー」システムについて 注3:セキュリティのプロセス(紙シュレッダー手法よりセキュリティの確保) 入力枠の切り出しは細かいほどデータの安全性が高いので、文字列の単語単位まで抽出することにする。 NO NO NO 1 NO1 11 NOXXX XX X1 XXX NO NO NO 2 NO2 22 NO NO NO3 NO3 3 3 NO NO NO 2 XXX 22 NO NO NO NO4 44 4 NO NO NO NO5 55 5 NO NO NO NO6 66 6 発注側複数の原票画像か らPGで入力する枠を抽出し、 切り出します。 抽出した各枠にファイル名をつけ て整理する。この時に各項目の順 番があります。 NO NO XXX 33 XXX XXX NO NO XXX 44 XXX NO NO XX 5 X5 XXX NO XXX XXX 入力枠のファイル名に暗号をかけ る。暗号化済みの画像のみを受注 側へ転送。この場合に各項目の順 番はなくなります。 「ザバンイー」システム入力画面(漢字) 「ザバンイー」システム入力画面(かな) 「ザバンイー」システム処理のプロセス コンピュータに任せられることは バッチ処理 元画像の受領 (イメージデータ) すべてコンピュータに任せよ! 画像解析技術による元画像の分類整理 入力項目の抽出 ①画像分析システム 自動認識の結果を、元画像と ともにDBに吸い上げ VPNのLANシステム 入力作業 DB中の校正済みの Client データのポスト処理 (データ復元処理) データベース サーバ 入力作業 Client 入力作業 Client 納品用分類 校正結果評価 納品 ③入力データのポスト処理システム Client側 修正作業 ②LANシステム 作業対象&基本参考単価 作業対象 各種データエントリーの原稿(一般文章、名刺、各種帳票) 各種の文字種類(手書き、活字、英数字、漢字、仮名) 作業規模 長春の計算機学校と提携して入力基地を設け300人の作業員を確保。 一日は最大400万文字の入力は対応可能。 基本参考単価(品質99.98%の場合) 英数字(半角)の場合は0.1円/文字、 漢字(仮名も含む全角)の場合は0.2円/文字。 その他の特殊処理については実際の仕様を検討してから、見積りを提出します。
© Copyright 2024 ExpyDoc