2014.06.30(最終更新日 2024.12.09 )

  • 文書管理

検索性を向上させる方法を紹介します

こんにちは。「鈴与のデータソリューション」ライターチームです。
文書情報は、必要なときに利用できてこそ、初めて意味があります。そのためには、文書を電子化すると共に、そのデータに「検索性」を持たせることが重要となります。大量の文書から、必要な情報に高速でたどり着ける検索システムが、文書情報の利便性を飛躍的に向上させ、業務の効率を大きく左右するのです。
今回は、一般的な検索方法と、より少ない手間とコストで検索システムを利用する方法についてご紹介します。

キーワード検索

〜文書に関連する項目から、検索する〜

まずは、一般的に用いられるキーワード検索についてご紹介します。文書の固有な項目(文書名、管理番号、作成者、作成日など)をキーワードとしてデータベースに登録しておき、必要な項目を入力して検索する方法です。

文書の情報をインデックス化するため、データ容量が比較的小さく、検索速度を高速化できるという利点があります。
また、

「○○以上」「○○以下」
「○○を含む」「○○を含まない」
「○○ AND ○○」( ○○と○○を両方含む )
「○○ OR ○○」( ○○または○○を含む )

といった、論理検索を組み合わせることで、検索の柔軟性を高めることができます。

一方、注意すべき点として、他部署など、組織の中のさまざまな人がその文書を活用するケースがあるということを念頭に置き、他の人が検索しやすいようにキーワードを設定する必要があります。たとえば、図書館のように専門的に記録や文書を扱うところでは、ダブリンコアメタデータというものが国際的に標準化され、検索キーワードのフォーマットが定められています。

お役立ち資料をお手元で確認できます!
▶︎「文書管理 虎の巻」ダウンロードはこちら

全文検索

〜必要なテキストに直接たどり着く〜

最近では、OCR(Optical Character Reader/光学式文字読み取り装置)の発達により、スキャナで読み取ったイメージデータから文字情報を読み取り、テキスト化することができます。この技術によって、文書中のすべてのテキストを対象にした全文検索が、高精度に行えるようになってきました。全文検索には、より直接的に求める情報にたどり着けるという利点があります。

OCRは、定型の帳票や伝票の決められた場所を読み取る「伝票OCR」と契約書や一般的な非定型の文書などから文書イメージをすべてテキスト化する「文書OCR」に大きく分けられます。ここ数年は、手書き文字を認識する技術も向上しており、数百〜千種類もの帳票を扱うと言われる保険業界などでも、こうした技術が業務効率のアップに活かされています。

また、文書の作成時に、管理番号や申込書番号をバーコードとして印刷しておくことで、スキャニングと同時にインデックス情報を読み取ることができるようになり、入力作業がスムーズになります。

検索方式 キーワード検索 全文検索
適した書類 伝票、契約書、稟議書などの比較的定型で長期にわたり継続的に電子化していくもの 図書、論文、新聞など記載内容について検索する必要があるもの
作成手法
( ○ 可 / ◎ 最適 )
◎ PC入力
◎ OCR活用
○ PC入力
◎ OCR活用
長所と短所 検索が容易且つ明確だが、検索項目の追加や変更する場合はシステムの変更も必要となる 該当する情報すべての検索が可能だが、入力には膨大な工数を要し、OCR活用では認識精度によっては補正入力が必要となる

 

クラウドの利用

クラウドを利用し、手間とコスト、リスクを減らす

キーワード検索や全文検索を組み合わせることで、大量の文書から必要な情報をスピーディに見つけ出せるようになります。しかし、このような検索システムを構築するためには、専門のノウハウが必要です。また、社内サーバーの運営や保守、システムの更新などに大きなコストがかかる場合もあります。

そこで、文書管理システムのクラウドサービスを利用するという選択肢も検討してみてはいかがでしょうか。専門のノウハウを持つプロフェッショナルが構築したクラウドを利用することで、自社でサーバーやエンジニアを抱える必要がなく、利便性の高い検索システムを活用することができます。また、運営・更新のコストをかけずに、常に最新のサービスを利用できるのも魅力です。

さらに、災害対策などBCPの観点から見ても、複数のデータセンターに情報のバックアップが可能な専門業者にシステム管理を依頼する方が、大きな安心を得ることができます。

関連リンク

お問い合わせはこちら

Contact Us

関連記事