Whatsapp

gImageReader – Ekstrak Teks daripada Imej dan PDF dalam Linux

Anonim

gImageReader ialah pembaca PDF percuma dan sumber terbuka dengan keupayaan untuk mengekstrak teks daripada imej dan PDF. Ia dibina sebagai bahagian hadapan Gtk/Qt ringkas kepada Tesseract-OCR, enjin OCR sumber terbuka untuk mengecam teks dan corak dalam dokumen dan imej menggunakanKecerdasan Buatan

Sendiri, Tesseract ialah alat baris arahan yang terhad kepada penggunaan oleh pengguna Linux yang cukup biasa dengan terminal mereka. Terima kasih kepada gImageReader, semua orang kini boleh memanfaatkan kecekapan OCR enjin.

gImageReader berfungsi dengan mengimbas teks daripada PDF atau fail gambar dalam mana-mana beberapa bahasa yang disokongnya berkat kewujudan aksara Unicode . Ia menampilkan antara muka pengguna tersuai yang mudah dan tersusun yang membolehkan anda menjalankan tugas semakan ejaan dan terjemahan.

Ciri dalam gImageReader

gImageReader mudah digunakan dan menyokong kerja dengan dokumen salinan lembut serta syot kilat media yang dimuat naik cth. tangkapan skrin. Anda juga mempunyai pilihan untuk memilih kawasan teks yang anda minati dan menambah hanya teks yang anda perlukan. Akhirnya, gImagereader berfungsi sebagai kedua-dua pembaca PDF dan alat pengekstrakan teks. Perkara bodoh.

Pasang gImageReader pada Linux

Untuk menggunakan gImageReader sepenuhnya, anda mesti memasang Tesseract secara manual pek bahasa supaya anda boleh menganalisis imej dan fail dengan betul.Pakej itu dipanggil 'Tesseract-ocr-eng' dan ia boleh didapati daripada pengurus perisian dalam Debiandan Fedora distro.

Jika anda menjalankan Ubuntu, anda hanya boleh menambah PPAdan jalankan arahan pemasangan menggunakan arahan di bawah:

$ sudo add-apt-repository ppa:sandromani/gimagereader
kemas kini $ sudo apt
$ sudo apt install giimagereader

Pada Debian, Fedora, dan OpenSUSE memasangnya daripada pengurus pakej.

$ sudo apt install giimagereader
$ sudo dnf pasang giimagereader
$ sudo zypper pasang giimagereader

Jangan berasa tersisih jika anda menjalankan Arch Linux atau mana-mana derivatifnya. AUR telah membantu anda. Dan jika anda lebih suka membina semula apl daripada sumber, arahan ada dalam pautan Wiki repositori GitHubnya.

Adakah anda seorang yang mengekstrak teks bercetak daripada imej? Anda juga boleh mengambil gambar kawasan terpilih dengan telefon anda dan memuat naiknya ke komputer riba anda. Apa yang lebih menarik ialah sokongan berbilang bahasanya – yang walaupun tidak sempurna, sudah menjadi salah satu pilihan terbaik dalam komuniti sekarang.

gImageReader ialah antara pembaca PDF terbaik dalam dunia sumber terbuka terutamanya dengan keupayaan OCRnya jadi cuba dan lihat sahaja bagaimana anda menyukainya.

Seperti biasa, anda dialu-alukan untuk berkongsi pengalaman anda dengan aplikasi dengan kami jika anda mempunyai apa-apa. Dan untuk menambah cadangan lain di bahagian komen di bawah.