Αλγόριθμος Binarization Bradley
Εισαγωγή
Σε αυτό το σεμινάριο, θα σας καθοδηγήσουμε στη διαδικασία μετατροπής μιας σελίδας PDF σε εικόνα TIFF χρησιμοποιώντας τον Αλγόριθμο Binarization Bradley. Το Aspose.PDF για .NET απλοποιεί αυτήν την εργασία, επιτρέποντάς σας να αυτοματοποιείτε και να βελτιστοποιείτε εύκολα τις ροές εργασίας των εγγράφων σας.
Προαπαιτούμενα
Πριν ξεκινήσουμε, βεβαιωθείτε ότι έχετε τα εξής:
- Aspose.PDF για .NET: Λήψη της βιβλιοθήκης απόεδώ.
- Visual Studio (ή οποιοδήποτε C# IDE).
- Βασικές γνώσεις C#.
- Μια έγκυρη άδεια ή απροσωρινή άδεια από τον Aspose.
Βήμα 1: Ρύθμιση του έργου σας
Πρώτα, δημιουργήστε ένα νέο έργο C# στο IDE σας και εισαγάγετε τους απαραίτητους χώρους ονομάτων:
using System.IO;
using System;
using Aspose.Pdf;
Βήμα 2: Ορίστε τον Κατάλογο Εγγράφων
Καθορίστε τη διαδρομή προς τον κατάλογο όπου βρίσκεται το έγγραφο PDF σας, καθώς και τις διαδρομές εξόδου για τις εικόνες TIFF:
string dataDir = "YOUR DOCUMENT DIRECTORY"; // Διαδρομή προς το αρχείο PDF σας
Αυτός ο κατάλογος θα αποθηκεύσει τόσο το PDF προέλευσης όσο και τα αρχεία TIFF που έχουν μετατραπεί.
Βήμα 3: Φορτώστε το έγγραφο PDF
Ανοίξτε το έγγραφο PDF που θέλετε να μετατρέψετε:
Document pdfDocument = new Document(dataDir + "PageToTIFF.pdf");
ΑντικαθιστώPageToTIFF.pdf
με το όνομα του αρχείου PDF σας.
Βήμα 4: Καθορίστε τις διαδρομές εξόδου
Καθορίστε τις διαδρομές εξόδου για τα αρχεία TIFF που δημιουργούνται:
string outputImageFile = dataDir + "resultant_out.tif";
string outputBinImageFile = dataDir + "37116-bin_out.tif";
Βήμα 5: Ορίστε την ανάλυση εικόνας
Ρυθμίστε την ανάλυση για τις εικόνες TIFF. Ένα υψηλότερο DPI θα αποφέρει καλύτερη ποιότητα εικόνας:
Resolution resolution = new Resolution(300);
Βήμα 6: Διαμορφώστε τις ρυθμίσεις TIFF
Διαμορφώστε τις ρυθμίσεις για την εικόνα TIFF, συμπεριλαμβανομένης της συμπίεσης και του βάθους χρώματος:
TiffSettings tiffSettings = new TiffSettings
{
Compression = CompressionType.LZW,
Depth = Aspose.Pdf.Devices.ColorDepth.Format1bpp
};
Η χρήση 1 bpp (1 bit ανά pixel) προετοιμάζει την εικόνα για δυαδική έξοδο.
Βήμα 7: Δημιουργήστε τη συσκευή TIFF
Δημιουργήστε μια συσκευή TIFF που θα χειριστεί τη μετατροπή:
TiffDevice tiffDevice = new TiffDevice(resolution, tiffSettings);
Βήμα 8: Μετατρέψτε τη σελίδα PDF σε TIFF
Μετατρέψτε την πρώτη σελίδα του PDF σε εικόνα TIFF:
tiffDevice.Process(pdfDocument, outputImageFile);
Βήμα 9: Εφαρμόστε τον αλγόριθμο δυαδοποίησης Bradley
Τώρα, εφαρμόστε τον αλγόριθμο Bradley για να μετατρέψετε την εικόνα TIFF σε κλίμακα του γκρι σε δυαδική εικόνα:
using (FileStream inStream = new FileStream(outputImageFile, FileMode.Open))
{
using (FileStream outStream = new FileStream(outputBinImageFile, FileMode.Create))
{
tiffDevice.BinarizeBradley(inStream, outStream, 0.1);
}
}
ΟBinarizeBradley
Η μέθοδος παίρνει δύο ροές αρχείων (εισόδου και εξόδου) και μια τιμή κατωφλίου. Προσαρμόστε το όριο όπως απαιτείται για βέλτιστα αποτελέσματα.
Βήμα 10: Επιβεβαιώστε την επιτυχή μετατροπή
Τέλος, επιβεβαιώστε ότι η μετατροπή ήταν επιτυχής:
Console.WriteLine("Conversion using Bradley algorithm performed successfully!");
Σύναψη
Συγχαρητήρια! Μετατρέψατε με επιτυχία μια σελίδα PDF σε εικόνα TIFF και εφαρμόσατε τον αλγόριθμο δυαδοποίησης Bradley χρησιμοποιώντας το Aspose.PDF για .NET. Αυτή η διαδικασία είναι απαραίτητη για την αρχειοθέτηση εγγράφων, το OCR και άλλες επαγγελματικές εφαρμογές. Με ανάλυση υψηλής ποιότητας και αποτελεσματική συμπίεση, οι εικόνες των εγγράφων σας θα είναι καθαρές και διαχειρίσιμες σε μέγεθος.
Συχνές ερωτήσεις
Τι είναι ο αλγόριθμος Bradley;
Ο αλγόριθμος Bradley είναι μια τεχνική δυαδοποίησης που μετατρέπει εικόνες σε κλίμακα του γκρι σε δυαδικές εικόνες καθορίζοντας ένα προσαρμοστικό όριο για κάθε pixel με βάση το περιβάλλον του.
Μπορώ να μετατρέψω πολλές σελίδες PDF σε TIFF χρησιμοποιώντας αυτήν τη μέθοδο;
Ναι, μπορείτε να τροποποιήσετε τοProcess
μέθοδος αναζήτησης βρόχου σε όλες τις σελίδες του εγγράφου για μετατροπή.
Ποια είναι η βέλτιστη ανάλυση για τη μετατροπή αρχείων PDF σε TIFF;
Η ανάλυση 300 DPI συνιστάται γενικά για εικόνες υψηλής ποιότητας, αλλά μπορείτε να την προσαρμόσετε με βάση τις συγκεκριμένες ανάγκες σας.
Τι σημαίνει 1 bpp σε βάθος χρώματος;
bpp (1 bit ανά pixel) υποδηλώνει ότι η εικόνα θα είναι ασπρόμαυρη, με κάθε εικονοστοιχείο να είναι είτε πλήρως μαύρο είτε πλήρως λευκό.
Είναι ο αλγόριθμος Bradley κατάλληλος για OCR;
Ναι, ο αλγόριθμος Bradley χρησιμοποιείται συχνά στην προεπεξεργασία OCR επειδή ενισχύει την αντίθεση του κειμένου στα σαρωμένα έγγραφα, βελτιώνοντας την ακρίβεια αναγνώρισης.