MƏTNIN TANINMASI. PULSUZ PROQRAM - FINEREADER-IN ANALOQU

Send

Gec-tez ofis proqramları ilə tez-tez işləyən hər kəs adi bir işlə üzləşirlər - kitabdan, jurnaldan, qəzetdən mətnləri, sadəcə vərəqələri skan etmək və sonra bu şəkilləri mətn formatına, məsələn, Word sənədinə çevirmək.

Bunu etmək üçün bir skaner və mətni tanımaq üçün xüsusi bir proqram lazımdır. Bu yazıda FineReader-in pulsuz həmkarı müzakirə ediləcək -Cuneiform (FineReader-də tanınma haqqında - bu məqaləyə baxın).

Başlayaq ...

Mündəricat

1. CuneiForm proqramının xüsusiyyətləri, xüsusiyyətləri
2. Mətn tanıma nümunəsi
3. Batch mətn tanınması
4. Nəticələr

1. CuneiForm proqramının xüsusiyyətləri, xüsusiyyətləri

Cuneiform

Bunu geliştirici saytından yükləyə bilərsiniz: //cognitiveforms.com/

Açıq mənbə mətn tanıma proqramı. Bundan əlavə, Windows-un bütün versiyalarında işləyir: XP, Vista, 7, 8, sevindirir. Üstəlik, proqramın tam rus dilindəki tərcüməsini əlavə edin!

Pros:

- Dünyanın 20 ən populyar dillərində mətn tanınması (ingilis və rus dillərinin özü bu nömrəyə daxildir);

- Müxtəlif çap şriftlərinə böyük dəstək;

- tanınmış mətnin lüğətini yoxlamaq;

- iş nəticələrini bir neçə yolla saxlamaq imkanı;

- sənədin strukturunun qorunması;

- Böyük dəstək və masanın tanınması.

Eksiler:

- çox böyük sənəd və sənədləri (400 dpi-dən çox) dəstəkləmir;

- Bəzi skaner növlərini birbaşa dəstəkləmir (yaxşı, yaxşıdır, xüsusi skaner proqramı skaner drayverləri ilə də daxil edilir);

- dizayn parılmır (ancaq proqram problemi tam həll edərsə kimə lazımdır).

2. Mətn tanıma nümunəsi

Tanıma üçün lazımlı şəkilləri aldığınıza inanırsınız (İnternetdə skanerdən alındı və ya pdf / djvu formatında bir kitab yüklədiniz və onlardan lazımi şəkilləri çıxardın. Bunu necə etmək üçün bu məqaləyə baxın).

1) CuineForm proqramında istədiyiniz şəkli açın (fayl / açıq və ya "Cntrl + O").

2) Tanınmağa başlamaq üçün - əvvəlcə müxtəlif sahələri seçməlisiniz: mətn, şəkillər, masalar və s. Cuneiform proqramında bu işi yalnız əllə deyil, həm də etmək olar avtomatik olaraq! Bunu etmək üçün, pəncərənin yuxarı panelindəki "layout" düyməsini basın.

3) 10-15 saniyədən sonra. Proqram avtomatik olaraq bütün sahələri fərqli rənglərlə vurğulayacaqdır. Məsələn, bir mətn sahəsi mavi ilə vurğulanmışdır. Yeri gəlmişkən, bütün sahələri düzgün və kifayət qədər tez qeyd etdi. Düzünü desəm, ondan belə tez və düzgün reaksiya gözləmirdim ...

4) Avtomatik tərtibata etibar etməyənlər üçün əl ilə istifadə edə bilərsiniz. Bunu etmək üçün bir alət çubuğu var (aşağıdakı şəkilə baxın), bunun sayəsində seçə bilərsiniz: mətn, masa, şəkil. İlkin görüntüyü dəyişdirin, böyüdün / azaldın, kənarlarını kəsin. Ümumiyyətlə, yaxşı bir dəst.

5) Bütün sahələr qeyd olunduqdan sonra davam edə bilərik tanınması. Bunu etmək üçün aşağıdakı şəkildəki kimi eyni adı olan düyməni vurun.

6) Sanki 10-20 saniyədə. Microsoft Word-də tanınmış mətn ilə bir sənəd görəcəksiniz. Maraqlıdır ki, bu nümunə üçün mətndə əlbəttə ki, səhvlər var idi, amma bunların çox az hissəsi var! Bundan əlavə, mənbə materialının hansı keyfiyyətə sahib olmadığını nəzərə alaraq - şəkil.

Sürət və keyfiyyət FineReader ilə olduqca müqayisə olunur!

3. Batch mətn tanınması

Bu proqram funksiyası bir deyil, bir neçə şəkil tanımağınız lazım olduqda yararlana bilər. Batch tanıma üçün qısa yol ümumiyyətlə başlanğıc menyusunda gizlidir.

1) Proqramı açdıqdan sonra yeni bir paket yaratmalı və ya əvvəlcədən yadda qalan bir paketi açmalısınız. Bizim nümunəmizdə yenisini yaradın.

2) Növbəti addımda ona altı ay sonra saxlanılanları xatırladan bir ad veririk.

3) Sonra sənəd sənədini (rus-ingilis) seçin, skan edilmiş materialınızda şəkillərin və cədvəllərin olub olmadığını göstərin.

4) İndi tanıma üçün sənədlərin yerləşdiyi qovluğu göstərməlisiniz. Yeri gəlmişkən, maraqlı olanı, proqramın özü tanıya və layihəyə əlavə edə biləcəyi bütün şəkilləri və digər qrafik faylları tapacaqdır. Yalnız əlavə hissəni çıxartmalısınız.

5) Növbəti addım vacib deyil - tanıdıqdan sonra mənbə sənədləri ilə nə edəcəyinizi seçin. "Heç nə etmə" onay qutusunu seçməyi məsləhət görürəm.

6) Yalnız tanınan sənədin saxlanılacağı formatı seçmək qalır. Bir neçə seçim var:

- rtf - bütün məşhur ofislər tərəfindən açılan bir söz sənədindən bir sənəd (pulsuz olanlar, proqramlara bir keçid daxil olmaqla);

- txt - mətn formatı, onda yalnız mətni saxlaya bilərsiniz, şəkillər və masalar ola bilməz;

- htm - sayt üçün faylları tarar və tanıyarsanız, rahat bir hiper mətn səhifəsidir. Bunu nümunəmizdə seçəcəyik.

7) "Bitir" düyməsini basdıqdan sonra layihənizin işlənməsi prosesi başlayacaq.

8) Proqram olduqca sürətli işləyir. Tanındıqdan sonra qarşınızda htm sənədləri olan bir nişan görünəcəkdir. Belə bir faylı tıklasanız, nəticələrini görə biləcəyiniz bir brauzer başlayır. Yeri gəlmişkən, paketi bundan sonra da işləmək üçün saxlamaq olar.

9) Gördüyünüz kimi nəticələr iş çox təsir edicidir. Proqram asanlıqla şəkli tanıdı və altındakı mətn asanlıqla tanınıb. Proqramın pulsuz olmasına baxmayaraq ümumiyyətlə superdir!

4. Nəticələr

Əgər tez-tez sənədləri skan etmirsinizsə və tanımırsınızsa, onda FineReader proqramını satın almanın mənası yoxdur. Əksər vəzifələr asanlıqla CuneiForm tərəfindən idarə olunur.

Digər tərəfdən, onun mənfi cəhətləri də var.

Birincisi, nəticəni düzəltmək və yoxlamaq üçün çox az vasitə var. İkincisi, çox sayda şəkil tanımağınız lazım olduqda, FineReader-də layihəyə əlavə olunan hər şeyi sağdakı sütunda görmək daha rahatdır: lazımsız olanları tez çıxarın, düzəlişlər edin və s. Üçüncüsü, CuneiForm sənədlərdə tanınma kimi itirir: Sənədi ağlıma gətirməliyəm - səhvləri redaktə etmək, durğu işarələri, kotirovkalar və s.

Hamısı budur. Digər layiqli pulsuz mətn tanıma proqramını bilirsinizmi?

Send