Algorytm binaryzacji Bradleya
Wstęp
tym samouczku przeprowadzimy Cię przez proces konwersji strony PDF na obraz TIFF przy użyciu algorytmu binaryzacji Bradleya. Aspose.PDF dla .NET upraszcza to zadanie, umożliwiając łatwą automatyzację i usprawnienie przepływów pracy nad dokumentami.
Wymagania wstępne
Zanim zaczniemy, upewnij się, że masz następujące rzeczy:
- Aspose.PDF dla .NET: Pobierz bibliotekę ze stronyTutaj.
- Visual Studio (lub dowolne środowisko IDE języka C#).
- Podstawowa znajomość języka C#.
- Ważne prawo jazdy lublicencja tymczasowa z Aspose.
Krok 1: Skonfiguruj swój projekt
Najpierw utwórz nowy projekt C# w swoim środowisku IDE i zaimportuj niezbędne przestrzenie nazw:
using System.IO;
using System;
using Aspose.Pdf;
Krok 2: Zdefiniuj katalog dokumentów
Podaj ścieżkę do katalogu, w którym znajduje się Twój dokument PDF, a także ścieżki wyjściowe dla obrazów TIFF:
string dataDir = "YOUR DOCUMENT DIRECTORY"; // Ścieżka do pliku PDF
W tym katalogu będą przechowywane zarówno źródłowe pliki PDF, jak i przekonwertowane pliki TIFF.
Krok 3: Załaduj dokument PDF
Otwórz dokument PDF, który chcesz przekonwertować:
Document pdfDocument = new Document(dataDir + "PageToTIFF.pdf");
ZastępowaćPageToTIFF.pdf
z nazwą Twojego pliku PDF.
Krok 4: Określ ścieżki wyjściowe
Zdefiniuj ścieżki wyjściowe dla generowanych plików TIFF:
string outputImageFile = dataDir + "resultant_out.tif";
string outputBinImageFile = dataDir + "37116-bin_out.tif";
Krok 5: Ustaw rozdzielczość obrazu
Ustaw rozdzielczość dla obrazów TIFF. Wyższe DPI da lepszą jakość obrazu:
Resolution resolution = new Resolution(300);
Krok 6: Skonfiguruj ustawienia TIFF
Skonfiguruj ustawienia obrazu TIFF, w tym kompresję i głębię kolorów:
TiffSettings tiffSettings = new TiffSettings
{
Compression = CompressionType.LZW,
Depth = Aspose.Pdf.Devices.ColorDepth.Format1bpp
};
Użycie 1bpp (1 bit na piksel) przygotowuje obraz do wyjścia binarnego.
Krok 7: Utwórz urządzenie TIFF
Utwórz urządzenie TIFF, które będzie obsługiwać konwersję:
TiffDevice tiffDevice = new TiffDevice(resolution, tiffSettings);
Krok 8: Konwertuj stronę PDF do TIFF
Konwertuj pierwszą stronę pliku PDF na obraz TIFF:
tiffDevice.Process(pdfDocument, outputImageFile);
Krok 9: Zastosuj algorytm binaryzacji Bradleya
Teraz zastosuj algorytm Bradleya, aby przekonwertować obraz TIFF w skali szarości na obraz binarny:
using (FileStream inStream = new FileStream(outputImageFile, FileMode.Open))
{
using (FileStream outStream = new FileStream(outputBinImageFile, FileMode.Create))
{
tiffDevice.BinarizeBradley(inStream, outStream, 0.1);
}
}
TenBinarizeBradley
metoda przyjmuje dwa strumienie plików (wejście i wyjście) oraz wartość progową. Dostosuj próg w razie potrzeby, aby uzyskać optymalne wyniki.
Krok 10: Potwierdź pomyślną konwersję
Na koniec potwierdź, że konwersja zakończyła się powodzeniem:
Console.WriteLine("Conversion using Bradley algorithm performed successfully!");
Wniosek
Gratulacje! Udało Ci się przekonwertować stronę PDF na obraz TIFF i zastosować algorytm binaryzacji Bradleya przy użyciu Aspose.PDF dla .NET. Ten proces jest niezbędny do archiwizacji dokumentów, OCR i innych profesjonalnych aplikacji. Dzięki wysokiej jakości rozdzielczości i wydajnej kompresji obrazy Twoich dokumentów będą wyraźne i łatwe w zarządzaniu rozmiarem.
Najczęściej zadawane pytania
Czym jest algorytm Bradleya?
Algorytm Bradleya to technika binaryzacji, która konwertuje obrazy w skali szarości na obrazy binarne, ustalając próg adaptacyjny dla każdego piksela na podstawie jego otoczenia.
Czy mogę przekonwertować wiele stron PDF do formatu TIFF za pomocą tej metody?
Tak, możesz zmodyfikowaćProcess
metoda umożliwiająca przejście przez wszystkie strony dokumentu w celu konwersji.
Jaka jest optymalna rozdzielczość przy konwersji plików PDF do formatu TIFF?
W przypadku obrazów wysokiej jakości zaleca się zazwyczaj rozdzielczość 300 DPI, można ją jednak dostosować do indywidualnych potrzeb.
Co oznacza 1bpp w głębi kolorów?
1bpp (1 bit na piksel) oznacza, że obraz będzie czarno-biały, przy czym każdy piksel będzie albo całkowicie czarny, albo całkowicie biały.
Czy algorytm Bradleya nadaje się do OCR?
Tak, algorytm Bradleya jest często używany podczas wstępnego przetwarzania OCR, ponieważ poprawia kontrast tekstu w zeskanowanych dokumentach, co przekłada się na większą dokładność rozpoznawania.