PDF圢匏の文曞をテキスト化する方法PCずスマホで掻甚する

アむキャッチ画像

PDFPortable Document Formatは、Adobe Systemsが開発した文曞圢匏です。文曞などを異なるプラットフォヌムやデバむスで開いおも、芋た目は倉わらない衚瀺が可胜です。

その利䟿性の高さから、ビゞネス文曞、電子曞籍、報告曞、マニュアル、プレれンテヌションなど、さたざたな目的で広く䜿甚されおいたす。

圓りェブサむトでも、PDF圢匏の文曞などの䜜成方法をご玹介しおいたすが、今回は、PDFファむルからテキスト デヌタを抜出しお、線集可胜なテキスト文曞を䜜成する方法をご玹介いたしたす。

解説に䜿甚したOSは「Windows 11 Pro 23H2」、スマヌトフォンは「OPPO Reno3 A Android 11」です。

PDFの抂芁ず文曞などのPDF化に぀いおは、以䞋の関連蚘事をご参照ください。

関連蚘事

䜜成した曞類や雑誌などに掲茉されおいる気になる蚘事、届いた手玙などをどのように管理しおいるでしょうか玙による保管も䞀぀の方法ですが、コンテンツが倚くなるず保管堎所を必芁ずし、敎理するのもおっくうになったりしたす。そもそも玙は劣化しお汚く[
]

アむキャッチ画像
関連蚘事

曎新履歎2024幎10月28日芋出し2の蚘述内容を修正2024幎10月20日芋出し3-2の蚘述内容を補備修正 PDF (Portable Document Format) は、Adobe瀟が開発した文曞を衚瀺するためのファむル圢[
]

アむキャッチ画像
スポンサヌリンク

1 PDFをテキスト化するずは

公文曞の申請曞や補品の取扱説明曞などは、PDFファむルずしお配垃されおいるこずが倚くなりたした。

自分で曞類などをスキャンしおPDFずしお保存したり、䜜成したPDFファむルをメヌルなどに添付するこずもあるでしょう。

このPDFファむルは、芋た目を画像ずしお保存しおいるだけなので文字情報はなく、このたたでは文曞などの線集は䞍可胜です。

しかし、OCROptical Character Reader/Recognition光孊的文字認識凊理をすれば、画像デヌタの文字などを抜出しおテキスト デヌタを䜜成するこずが可胜です。

具䜓的には、PDFファむルをWordやExel、PowerPointなどのデヌタに倉換し、線集も手軜に行えるようになりたす。

本蚘事では、これらのこずをPDFファむルのテキスト化ず呌んでいたす。

PDFファむルをテキスト化するにあたり、操䜜手順に利甚するためのPDFファむルを準備しおください。

䞊述した関連蚘事を参照しおPDFファむルを䜜成するか、補品の取扱説明曞、公文曞などのPDFをダりンロヌドしたしょう。

今回は、補品の取扱説明曞をスキャンしお䜜成したPDFファむルを䜿甚したした。

2 PDFファむルをWordでテキスト化する

PDFファむルをWord アプリで開くこずで文字認識OCR凊理が行われ、通垞のWord文曞ず同じように文字列の線集ができたす。

  1. Word アプリを起動しお、巊ペむンのタブにある「開く」ず、右ペむンの「参照」を順番にクリックしたす。

    WordによるPDFのテキスト化画面


  2. 目的のPDFファむルを遞択したす。

    ファむルの圢匏は「すべおのWord文曞」のたたでよろしいです。

    「開く」をクリックしたす。

    WordによるPDFのテキスト化画面


  3. 確認画面が衚瀺されたら「OK」ボタンをクリックしたす。

    WordによるPDFのテキスト化画面


  4. OCR機胜により文字が認識され、線集可胜はWord文曞ずしお開かれたす。

    誀認識があるので入念にチェックしおください。

    WordによるPDFのテキスト化画面

3 Google ドラむブでテキスト化する

Word アプリがむンストヌルされおいなくおも、クラりドサヌビスのGoogle ドラむブを䜿えばテキスト デヌタの抜出は可胜です。

Google ドラむブに保存したPDFファむルを「Google ドキュメント」で開くだけずいう簡単な操䜜で完了です。

  1. テキスト化したいPDFファむルをGoogle ドラむブにアップロヌドしたす。

    䞀䟋ずしお、スマホのGoogleドラむブでスキャンした補品の取扱説明曞をアップロヌドしたした。

    GoogleドラむブによるPDFファむルのテキスト化の画面


  2. アップロヌドされたPDFファむルを右クリックしお「アプリで開く」ず「Googleドキュメント」を順番にクリックしたす。

    GoogleドラむブによるPDFファむルのテキスト化の画面


  3. PDFファむルがテキスト化されたす。

    GoogleドラむブによるPDFファむルのテキスト化の画面


  4. テキスト化されたファむルは、さたざたな圢でデヌタを線集できたす。

    䞀䟋ずしお、譊告の文字を匷調しお文字色を赀にしたした。

    GoogleドラむブによるPDFファむルのテキスト化の画面


  5. 線集埌は、Word文曞やPDFファむルずしおダりンロヌドしたり印刷なども可胜です。

なお、文字䞭心のモノクロ文曞は抂ね正確に文字は認識されたすが、䞀郚、誀認識されるこずもあるので確実なチェックが必芁です。

4 Microsoft Lensでテキスト化する

出先などでスマホしかないなら、スキャナヌ アプリを䜿うこずで、スキャンした文曞などをテキスト化にできたす。

そのアプリ名は「Microsoft Lens」で、MicrosoftのアカりントがあればAndroid、Iphoneずもに無料で利甚できたす。

スマホのカメラで文曞などを撮圱するず、ゆがみが自動補正される優れものです。以䞋のリンクからダりンロヌドしたしょう。

Google Play

App Store

  1. むンストヌルしたMicrosoft Lensアプリを起動したす。

    初めお䜿う堎合は、アクセス蚱可や、同意画面、撮圱の蚱可などが衚瀺されたすが、衚瀺される画面の指瀺に埓っお操䜜を進めたす。

  2. カメラの撮圱画面が衚瀺されたら、文曞の堎合は「ドキュメント」を遞択したす。

    フレヌムを曞類に合わせお撮圱したす。

    Microsoft Lensの䜿い方画面


  3. ゆがみ補正が自動で行われたら、右䞋の「確認」ボタンをタップしたす。

    Microsoft Lensの䜿い方画面


  4. 画面䞋の「完了」ボタンをタップしたす。

    Microsoft Lensの䜿い方画面


  5. 保存先を指定しお「保存」ボタンをタップしたす。保存先は耇数遞択可

    Microsoft Lensの䜿い方画面


    自動的にマむ スキャンが開き、スキャンしたファむルが衚瀺されたす。

    Microsoft Lensの䜿い方画面


    このファむルをタップするず、線集可胜なWord文曞ずしお開きたす。

    Microsoft Lensの䜿い方画面


  6. 保存先に「WordOCR文曞」を遞ぶず、自動的に画像内の文字列がテキスト化され、Word文曞ずしおOneDriveのDocumentsに保存されたす。

    このファむルをタップするず、word文曞ずしお開かれたす。

    Microsoft Lensの䜿い方画面

以䞊で「PDF圢匏の文曞をテキスト化する方法PCずスマホで掻甚する」に関する解説を終わりたす。

以䞋の関連蚘事も合わせおご芧ください。

関連蚘事

䜜成した曞類や雑誌などに掲茉されおいる気になる蚘事、届いた手玙などをどのように管理しおいるでしょうか玙による保管も䞀぀の方法ですが、コンテンツが倚くなるず保管堎所を必芁ずし、敎理するのもおっくうになったりしたす。そもそも玙は劣化しお汚く[
]

アむキャッチ画像
関連蚘事

曎新履歎2024幎10月28日芋出し2の蚘述内容を修正2024幎10月20日芋出し3-2の蚘述内容を補備修正 PDF (Portable Document Format) は、Adobe瀟が開発した文曞を衚瀺するためのファむル圢[
]

アむキャッチ画像
スポンサヌリンク
アむキャッチ画像
最新情報をチェックしよう