อัลกอริธึมการไบนารีของแบรดลีย์
การแนะนำ
ในบทช่วยสอนนี้ เราจะแนะนำคุณเกี่ยวกับขั้นตอนการแปลงหน้า PDF เป็นภาพ TIFF โดยใช้อัลกอริทึม Bradley Binarization Aspose.PDF สำหรับ .NET ช่วยลดความซับซ้อนของงานนี้ ช่วยให้คุณสามารถจัดการและปรับกระบวนการทำงานเอกสารของคุณให้เป็นระบบอัตโนมัติได้อย่างง่ายดาย
ข้อกำหนดเบื้องต้น
ก่อนที่เราจะเริ่ม ให้แน่ใจว่าคุณมีสิ่งต่อไปนี้:
- Aspose.PDF สำหรับ .NET: ดาวน์โหลดไลบรารีจากที่นี่.
- Visual Studio (หรือ C# IDE ใดๆ)
- ความรู้พื้นฐานเกี่ยวกับ C#
- ใบอนุญาตที่ถูกต้องหรือใบอนุญาตชั่วคราว จาก Aspose
ขั้นตอนที่ 1: ตั้งค่าโครงการของคุณ
ขั้นแรก ให้สร้างโครงการ C# ใหม่ใน IDE ของคุณและนำเข้าเนมสเปซที่จำเป็น:
using System.IO;
using System;
using Aspose.Pdf;
ขั้นตอนที่ 2: กำหนดไดเรกทอรีเอกสาร
ระบุเส้นทางไปยังไดเร็กทอรีที่เอกสาร PDF ของคุณตั้งอยู่ รวมทั้งเส้นทางเอาต์พุตสำหรับภาพ TIFF:
string dataDir = "YOUR DOCUMENT DIRECTORY"; // เส้นทางไปยังไฟล์ PDF ของคุณ
ไดเร็กทอรีนี้จะจัดเก็บทั้งไฟล์ PDF ต้นฉบับและไฟล์ TIFF ที่แปลงแล้ว
ขั้นตอนที่ 3: โหลดเอกสาร PDF
เปิดเอกสาร PDF ที่คุณต้องการแปลง:
Document pdfDocument = new Document(dataDir + "PageToTIFF.pdf");
แทนที่PageToTIFF.pdf
พร้อมชื่อไฟล์ PDF ของคุณ
ขั้นตอนที่ 4: ระบุเส้นทางผลลัพธ์
กำหนดเส้นทางเอาต์พุตสำหรับไฟล์ TIFF ที่สร้างขึ้น:
string outputImageFile = dataDir + "resultant_out.tif";
string outputBinImageFile = dataDir + "37116-bin_out.tif";
ขั้นตอนที่ 5: ตั้งค่าความละเอียดของภาพ
ตั้งค่าความละเอียดสำหรับภาพ TIFF DPI ที่สูงขึ้นจะทำให้ได้คุณภาพของภาพที่ดีขึ้น:
Resolution resolution = new Resolution(300);
ขั้นตอนที่ 6: กำหนดค่าการตั้งค่า TIFF
กำหนดค่าการตั้งค่าสำหรับภาพ TIFF รวมถึงการบีบอัดและความลึกของสี:
TiffSettings tiffSettings = new TiffSettings
{
Compression = CompressionType.LZW,
Depth = Aspose.Pdf.Devices.ColorDepth.Format1bpp
};
การใช้ 1bpp (1 บิตต่อพิกเซล) จะเตรียมภาพสำหรับเอาต์พุตแบบไบนารี
ขั้นตอนที่ 7: สร้างอุปกรณ์ TIFF
สร้างอุปกรณ์ TIFF ที่จะจัดการการแปลง:
TiffDevice tiffDevice = new TiffDevice(resolution, tiffSettings);
ขั้นตอนที่ 8: แปลงหน้า PDF เป็น TIFF
แปลงหน้าแรกของ PDF เป็นภาพ TIFF:
tiffDevice.Process(pdfDocument, outputImageFile);
ขั้นตอนที่ 9: ใช้อัลกอริทึม Bradley Binarization
ตอนนี้ ให้ใช้อัลกอริทึม Bradley เพื่อแปลงภาพ TIFF ระดับสีเทาเป็นภาพไบนารี:
using (FileStream inStream = new FileStream(outputImageFile, FileMode.Open))
{
using (FileStream outStream = new FileStream(outputBinImageFile, FileMode.Create))
{
tiffDevice.BinarizeBradley(inStream, outStream, 0.1);
}
}
การBinarizeBradley
วิธีนี้ใช้สตรีมไฟล์สองสตรีม (อินพุตและเอาต์พุต) และค่าขีดจำกัด ปรับค่าขีดจำกัดตามต้องการเพื่อให้ได้ผลลัพธ์ที่ดีที่สุด
ขั้นตอนที่ 10: ยืนยันการแปลงสำเร็จ
สุดท้ายยืนยันว่าการแปลงสำเร็จ:
Console.WriteLine("Conversion using Bradley algorithm performed successfully!");
บทสรุป
ขอแสดงความยินดี! คุณได้แปลงหน้า PDF เป็นไฟล์ภาพ TIFF สำเร็จแล้ว และใช้อัลกอริทึม Bradley Binarization กับ Aspose.PDF สำหรับ .NET กระบวนการนี้มีความสำคัญสำหรับการเก็บถาวรเอกสาร OCR และแอปพลิเคชันระดับมืออาชีพอื่นๆ ด้วยความละเอียดคุณภาพสูงและการบีบอัดที่มีประสิทธิภาพ รูปภาพเอกสารของคุณจะชัดเจนและมีขนาดที่จัดการได้
คำถามที่พบบ่อย
แบรดลีย์อัลกอริทึมคืออะไร
อัลกอริทึมของแบรดลีย์เป็นเทคนิคการแปลงภาพเป็นไบนารีซึ่งจะแปลงภาพระดับสีเทาให้เป็นภาพไบนารีด้วยการกำหนดค่าเกณฑ์การปรับตัวสำหรับแต่ละพิกเซลตามสภาพแวดล้อมโดยรอบ
ฉันสามารถแปลงไฟล์ PDF หลายหน้าเป็น TIFF ด้วยวิธีนี้ได้หรือไม่?
ใช่ คุณสามารถปรับเปลี่ยนได้Process
วิธีการวนซ้ำผ่านหน้าทั้งหมดในเอกสารเพื่อการแปลง
ความละเอียดที่เหมาะสมที่สุดในการแปลงไฟล์ PDF เป็น TIFF คือเท่าใด
โดยทั่วไปขอแนะนำให้ใช้ความละเอียด 300 DPI สำหรับภาพคุณภาพสูง แต่คุณสามารถปรับเปลี่ยนได้ตามความต้องการเฉพาะของคุณ
1bpp หมายถึงอะไรในความลึกสี?
1bpp (1 บิตต่อพิกเซล) หมายถึงภาพจะเป็นสีขาวดำ โดยแต่ละพิกเซลจะเป็นสีดำสนิทหรือสีขาวสนิท
อัลกอริทึมของ Bradley เหมาะกับ OCR หรือไม่
ใช่ อัลกอริทึม Bradley มักใช้ในการประมวลผล OCR ก่อนการประมวลผล เนื่องจากช่วยเพิ่มความคมชัดของข้อความในเอกสารที่สแกน ทำให้ความแม่นยำในการจดจำเพิ่มขึ้น