İnternetdə bir PDF sənədindəki mətni tanıyın

Pin
Send
Share
Send


Mütəmadi surətdən istifadə edərək bir PDF sənədindən mətn çıxarmaq həmişə mümkün deyil. Çox vaxt bu cür sənədlərin səhifələrində kağız versiyalarının məzmunu skan olunur. Bu cür faylları tam redaktə olunan mətn məlumatlarına çevirmək üçün Optical Character Recognition (OCR) funksiyası olan xüsusi proqramlar istifadə olunur.

Bu cür qərarları həyata keçirmək çox çətindir və buna görə də çox pul tələb olunur. Mütəmadi olaraq PDF-dən mətni tanımaq lazımdırsa, müvafiq proqramı almaq məsləhətdir. Nadir hallarda, oxşar funksiyaları olan mövcud onlayn xidmətlərdən birini istifadə etmək daha məntiqli olacaqdır.

İnternetdən PDF-də mətni necə tanımaq olar

Əlbətdə ki, OCR onlayn xidmətlər xüsusiyyətlərinin tam hüquqlu masaüstü həlləri ilə müqayisədə daha məhduddur. Ancaq bu cür mənbələrlə ya pulsuz ya da nominal bir ödəniş üçün işləyə bilərsiniz. Əsas odur ki, onların əsas vəzifəsi, yəni mətn tanınması ilə müvafiq veb tətbiqetmələr də öhdəsindən gəlirlər.

Metod 1: ABBYY FineReader Online

Xidmət inkişafı şirkəti optik sənədlərin tanınması sahəsində liderlərdən biridir. Windows və Mac üçün ABBYY FineReader, PDF-in mətnə ​​çevrilməsi və onunla birlikdə işləmək üçün güclü bir həlldir.

Proqramın veb əsaslı analoqu, əlbəttə ki, funksionallıq baxımından ondan daha üstündür. Buna baxmayaraq, xidmət 190-dan çox dildə skanerdən və fotolardan mətni tanıya bilər. PDF sənədlərini Word, Excel və s sənədlərə çevirin sənədlər dəstəklənir.

ABBYY FineReader Onlayn Onlayn Xidmət

  1. Alət ilə işləməyə başlamazdan əvvəl saytda bir hesab yaradın və ya Facebook, Google və ya Microsoft hesabınızdan istifadə edərək daxil olun.

    Avtorizasiya pəncərəsinə getmək üçün düyməni vurun "Giriş" üst menyu çubuğunda.
  2. Girişdən sonra istədiyiniz PDF sənədini düyməni istifadə edərək FineReader-ə daxil edin "Fayl yüklə".

    Sonra vurun "Səhifə nömrələrini seçin" və mətni tanımaq üçün istədiyiniz aralığı göstərin.
  3. Sonra sənəddə mövcud olan dilləri, yaranan sənədin formatını seçin və düyməni vurun "Tanı".
  4. İşləndikdən sonra müddəti sənədin həcmindən tamamilə asılıdır, bitmiş faylı sadəcə adını tıklayaraq mətn məlumatları ilə yükləyə bilərsiniz.

    Və ya mövcud bulud xidmətlərindən birinə ixrac edin.

Xidmət, ehtimal ki, şəkillər və PDF sənədlərindəki ən dəqiq mətn tanıma alqoritmləri ilə fərqlənir. Ancaq təəssüf ki, onun pulsuz istifadəsi ayda işlənən beş səhifə ilə məhdudlaşır. Daha həcmli sənədlərlə işləmək üçün illik abunə almalı olacaqsınız.

Ancaq OCR nadir hallarda lazımdırsa, ABBYY FineReader Online kiçik PDF sənədlərindən mətn çıxarmaq üçün əla seçimdir.

Metod 2: Pulsuz Online OCR

Mətnin rəqəmləşdirilməsi üçün sadə və rahat xidmət. Qeyd olmadan, resurs saatda 15 tam PDF səhifəni tanımağa imkan verir. Pulsuz Online OCR 46 dildə sənədlərlə tam işləyir və icazəsiz üç mətn ixrac formatını dəstəkləyir - DOCX, XLSX və TXT.

Qeydiyyatdan keçərkən istifadəçi çox səhifəli sənədləri emal etmək imkanı əldə edir, lakin eyni səhifələrin pulsuz sayı 50 vahidlə məhdudlaşır.

Pulsuz Online OCR Onlayn Xidmət

  1. PDF-dəki mətni "qonaq" olaraq tanımaq üçün, mənbəyə icazəsi olmadan saytın əsas səhifəsindəki müvafiq formadan istifadə edin.

    Düyməni istifadə edərək istədiyiniz sənədi seçin Fayl, mətnin əsas dilini, çıxış formatını göstərin, sonra faylın yüklənməsini və vurulmasını gözləyin Dönüştür.
  2. Rəqəmsal prosesin sonunda vurun "Çıxış faylı yükləyin" kompüterdə mətn ilə bitmiş sənəd saxlamaq.

Səlahiyyətli istifadəçilər üçün hərəkətlərin ardıcıllığı bir qədər fərqlidir.

  1. Düyməni istifadə edin "Qeydiyyat" və ya "Giriş" üst menyu çubuğunda, müvafiq olaraq Pulsuz Online OCR hesabı yaratmaq və ya daxil olmaq.
  2. Tanıma panelindəki icazədən sonra açarı basıb saxlayın CTRL, verilən siyahıdan mənbə sənədinin iki dilini seçin.
  3. PDF-dən mətn çıxarmaq üçün əlavə seçimləri göstərin və vurun Fayl seçin xidmətə sənəd yükləmək.

    Sonra, tanınmağa başlamaq üçün vurun Dönüştür.
  4. Sənədi emal etdikdən sonra müvafiq sütundakı çıxış faylının adı olan linki vurun.

    Tanınma nəticəsi dərhal kompüterinizin yaddaşında saxlanacaqdır.

Kiçik bir PDF sənədindən mətn çıxarmaq lazımdırsa, yuxarıdakı alətdən istifadə edərək etibarlı şəkildə müraciət edə bilərsiniz. Həcmli fayllarla işləmək üçün Pulsuz Online OCR-də əlavə simvol almalı və ya başqa bir həll istifadə etməlisiniz.

Metod 3: NewOCR

DjVu və PDF kimi demək olar ki, hər hansı bir qrafik və elektron sənədlərdən mətn çıxarmağa imkan verən tamamilə pulsuz OCR xidməti. Resurs, tanınan sənədlərin ölçüsünə və sayına məhdudiyyət qoymur, qeydiyyatı tələb etmir və əlaqəli müxtəlif funksiyaları təklif edir.

NewOCR 106 dili dəstəkləyir və hətta aşağı keyfiyyətli sənəd taramalarını düzgün emal edə bilər. Fayl səhifəsində mətni tanımaq üçün ərazini əl ilə seçmək mümkündür.

NewOCR Onlayn Xidmət

  1. Beləliklə, lazımsız hərəkətlər etmədən dərhal bir qaynaqla işə başlaya bilərsiniz.

    Doğru səhifədə sənədin sayta idxalı üçün bir forma var. NewOCR-a bir fayl yükləmək üçün düyməni istifadə edin "Fayl seçin" bölmədə "Faylınızı seçin". Sonra tarlada "Tanınma dili (lər)" mənbə sənədinin bir və ya daha çox dilini göstərin, sonra vurun "Yükləyin + OCR".
  2. Tercih olunan tanıma parametrlərinizi seçin, mətn çıxarmaq istədiyiniz səhifəni seçin və düyməni vurun OCR.
  3. Səhifəni bir az aşağı fırladın və düyməni tapın "Yükləmə".

    Bunun üzərinə vurun və açılan siyahıdan yükləmək üçün tələb olunan sənəd formatını seçin. Bundan sonra, çıxarılan mətn olan hazır fayl kompüterinizə yüklənəcəkdir.

Alət rahatdır və kifayət qədər yüksək keyfiyyət bütün simvolları tanıyır. Bununla birlikdə, idxal olunan PDF sənədinin hər səhifəsinin emalına müstəqil başlamalı və ayrı bir sənəddə göstərilir. Əlbətdə ki, tanınma nəticələrini dərhal panoya kopyalaya və başqalarına birləşdirə bilərsiniz.

Buna baxmayaraq, yuxarıda təsvir olunan bir nüansı nəzərə alaraq NewOCR istifadə edərək böyük miqdarda mətn çıxarmaq çox çətindir. Kiçik sənədlərlə, xidmət bir bang ilə mübarizə aparır.

Metod 4: OCR.Space

Mətnin rəqəmsallaşdırılması üçün sadə və başa düşülən bir resurs, bu PDF sənədlərini tanımağa və nəticəni TXT sənədinə çıxarmağa imkan verir. Səhifələrin sayına heç bir məhdudiyyət verilmir. Yeganə məhdudiyyət, giriş sənədinin ölçüsünün 5 meqabaytdan çox olmamasıdır.

OCR.Space Onlayn Xidmət

  1. Alət ilə işləmək üçün qeydiyyatdan keçmək lazım deyil.

    Yuxarıdakı linki izləyin və düyməni istifadə edərək PDF sənədini veb saytından veb saytına yükləyin "Fayl seçin" ya da şəbəkədən - istinadla.
  2. Açılan siyahıda "OCR dilini seçin" İdxal olunan sənədin dilini seçin.

    Sonra düyməni basaraq mətni tanıma prosesinə başlayın "OCR başlayın!".
  3. Fayl emalının sonunda, nəticəni sahəyə oxuyun OCR'in Nəticəsi və vurun "Yükləmə"bitmiş TXT sənədini yükləmək üçün.

Mətni PDF-dən çıxarmaq lazımdır və eyni zamanda onun son formatlanması heç də vacib deyil, OCR.Space yaxşı bir seçimdir. Yeganə, sənədin eyni vaxtda iki və ya daha çox dildə tanınması təmin edilmədiyi üçün "təkbaşına" olmalıdır.

Buna da baxın: FineReader-in pulsuz analoqları

Məqalədə təqdim olunan onlayn alətləri qiymətləndirərək qeyd etmək lazımdır ki, ABBYY-dən FineReader Online OCR funksiyasını ən dəqiq və effektiv şəkildə idarə edir. Mətnin tanınmasının maksimum dəqiqliyi sizin üçün vacibdirsə, bu seçimi xüsusi olaraq nəzərdən keçirmək daha yaxşıdır. Ancaq çox güman ki, bunun üçün də pul ödəməli olacaqsınız.

Kiçik sənədləri rəqəmləşdirmək lazımdırsa və xidmətdəki səhvləri müstəqil şəkildə düzəltməyə hazırsınızsa, NewOCR, OCR.Space və ya Free Online OCR istifadə etmək məsləhətdir.

Pin
Send
Share
Send