تمام موضوعات

+
Home > منبع > PDF > دانش تشخیص نوری کاراکتر (او سی آر)

دانش تشخیص نوری کاراکتر (او سی آر)

او سی آر چیست؟

تشخیص کاراکتر نوری معمولا به صورت مختصر به او سی آر، ترجمه مکانیکی یا الکترونیکی تصاویر اسکن شده از متن دست نوشته typewritten یا چاپ شده به متن رمزگذاری شده با ماشین است.

علت استفاده از OCR

او سی آر به طور گسترده ای مورد استفاده برای تبدیل انواع مختلف اسناد مانند کاغذ اسکن اسناد و فایل های پی دی اف یا تصاویر گرفته شده توسط دوربین های دیجیتال به داده های قابل جستجو و ویرایش. در بعضی از محیط های حرفه ای (مانند کتابخانه ها، دفاتر)، هزاران کتاب و اسناد پشتیبان و بایگانی منظم اسکن شده. اسکنر صرفا عکس اصلی کاغذ اسناد در تصویر بر اساس اسناد اسکن شده در قالب پی دی اف نتیجه را می گیرد. موضوع اصلی را با پردازش و ذخیره سازی چنین حجم زیادی از اسناد اسکن شده ناتوانی در جستجو برای یک عبارت خاص یا نام داخل فایل است. همچنین هیچ متن می شود برجسته، کپی یا تغییر یافته زیرا نوشتار شامل یک فایل تصویری بزرگ به عنوان شخصیت فردی متن.

OCR Sample

قبل از انجام او سی آر تمام منطقه را در صفحه انتخاب و برجسته شده و هیچ متنی می توانید جستجو و ویرایش.

پس از انجام او سی آر و متن روی صفحه می توانید با انتخاب ابزار انتخاب، شما می توانید جستجو و ویرایش شخصیت کلمه و پاراگراف ها به راحتی.

چگونه Wondershare او سی آر پی دی اف ابزار شما کمک کند؟

Wondershare او سی آر پی دی اف ابزار می تواند کمک به شما در تشخیص متن از پی دی اف اسکن سریع و با دقت و حفظ نتیجه شناخته شده در فرمت های مختلف و قابل ویرایش.

Wondershare PDF Editor Pro for Mac: با برجسته او سی آر دقت و قالب حفظ فعال شما برای جستجو، تصحیح و کپی متن در پی دی اف اسکن شده و یا بر اساس تصویر به طور مستقیم بر روی مک. همچنین اجازه می دهد تا شما را به PDF های اسکن شده به متن فرمت شده صادرات بر اساس ورد و اکسل و پاورپوینت و EPUB, HTML و فرمت متن.

Wondershare PDF Converter Pro: تشخیص متن از PDF های اسکن شده با دقت OCR برجسته و چند Pdf اسکن شده می تواند تبدیل به متن بر اساس کلمه اکسل پاور پوینت EPUB HTML و متن اسناد در ویندوز.


Wondershare PDF Converter Pro for Mac: تشخیص متن از PDF های اسکن شده با دقت OCR برجسته و چند Pdf اسکن شده می تواند تبدیل به متن بر اساس کلمه اکسل پاور پوینت EPUB HTML و متن اسناد بر روی مک.

چگونه به بهبود کیفیت شناخت او سی آر

او سی آر شناخت کیفیت بستگی دارد تا حد زیادی در کیفیت تصویر است که تا حد زیادی بستگی به تنظیمات در سند اسکن روند استفاده می شود. دستیابی به کیفیت بهتر شناخت او سی آر برای مدارک اسکن شده خود را, نکاتی برای اسکن سند اینجا هستید:

فونت خیلی کوچک است
برای نتایج مطلوب به رسمیت شناختن اسکن اسناد چاپ شده در قلم های بسیار کوچک در وضوح بالاتر.
در اموال وضوح شیء ScanSourceSettings می توانید وضوح مورد نظر را مشخص.


منبع تصویر قطعنامه پیشنهادی
Reader 300 dpi برای متون معمولی (چاپ شده در قلم اندازه 10 pt یا بزرگتر)
Reader 400-600 نقطه در اینچ برای متون چاپ شده در فونت های کوچکتر (9pt یا کوچکتر)

تنظیم روشنایی
شما ممکن است نیاز به تنظیم تنظیمات روشنایی هنگام اسکن کردن در حالت سیاه و سفید. در اموال روشنایی شی ScanSourceSettings می توانید روشنایی مورد نظر را مشخص. مقدار متوسط حدود 50 درصد در اغلب موارد کافی باید.
اگر تصویر حاصل بیش از حد بسیاری از "پاره پاره" یا "گیر" با هم نامه حاوی، عیب یابی با استفاده از جدول زیر.

تصویر خود را به این شکل توصیه های
Good Quality این تصویر برای تشخیص مناسب است
Very Light
شخصیت هستند "پاره" یا بسیار سبک
  • کاهش روشنایی تصویر را تیره تر.
  • اسکن در سیاه و سفید. روشنایی به طور خودکار تنظیم خواهد شد.
  • Very Dark
    شخصیت بسیار تحریف شده هستند با هم گیر و یا پر
  • افزایش روشنایی تصویر روشن تر
  • اسکن در سیاه و سفید. روشنایی به طور خودکار تنظیم خواهد شد.
  • کیفیت چاپ
    فقیر و کیفیت اسناد با "سر و صدا" (یعنی تصادفی نقطه های سیاه یا speckles)، تاری و ناهموار نامه یا اریب خطوط و مرزهای جدول منتقل ممکن است نیاز به تنظیمات خاص اسکن. به عنوان مثال، این فکس و روزنامه:

    Print Quality

    اسناد با کیفیت فقیر در سیاه و سفید بهترین اسکن می شوند. هنگام اسکن کردن در سیاه و سفید، برنامه مقدار روشنایی مطلوب به طور خودکار را انتخاب کنید.
    حالت سیاه و سفید اطلاعات بیشتر در مورد حروف در متن اسکن شده به دستیابی به نتایج بهتر تشخیص هنگامی که اسناد متوسط به کیفیت پایین با توجه به حفظ.


    مقالات مرتبط

    سوالات مربوط به محصول? صحبت می کنند به طور مستقیم به تیم پشتیبانی ما >>

    بالا