Pobierz wszystkie załączniki z plików PDF

Wstęp

naszym cyfrowym świecie pliki PDF są niezbędne do udostępniania dokumentów — są wszechstronne, bezpieczne i mogą zawierać różne typy informacji, w tym osadzone załączniki. Czy kiedykolwiek musiałeś wyodrębnić te ukryte perełki z pliku PDF? Jesteś we właściwym miejscu! W tym samouczku pokażemy, jak używać Aspose.PDF dla .NET do wyodrębniania wszystkich załączników z pliku PDF. Niezależnie od tego, czy jesteś doświadczonym programistą, czy dopiero zaczynasz, ten przewodnik przeprowadzi Cię przez ten proces krok po kroku.

Wymagania wstępne

Zanim zagłębimy się w kod, upewnij się, że masz następujące elementy:

  1. Visual Studio: Upewnij się, że jest zainstalowany na Twoim komputerze.
  2. Aspose.PDF dla .NET: Pobierz i zainstaluj bibliotekę zTutaj.
  3. Podstawowa wiedza o języku C#: Znajomość programowania w języku C# pomoże Ci łatwiej zrozumieć fragmenty kodu.

Konfigurowanie środowiska

Aby rozpocząć, wykonaj następujące kroki, aby skonfigurować projekt C#:

Utwórz nowy projekt

Otwórz program Visual Studio i utwórz nowy projekt aplikacji konsolowej.

Dodaj odniesienie Aspose.PDF

  • Kliknij prawym przyciskiem myszy swój projekt w Eksploratorze rozwiązań.
  • Wybierz „Zarządzaj pakietami NuGet”.
  • Wyszukaj „Aspose.PDF” i zainstaluj najnowszą wersję.

Importuj wymagane przestrzenie nazw

Na górze pliku programu zaimportuj niezbędne przestrzenie nazw:

using System.IO;
using Aspose.Pdf;
using System;

Teraz, gdy wszystko jest już skonfigurowane, możemy zająć się wyodrębnianiem załączników z pliku PDF.

Krok 1: Określ katalog dokumentów

Zdefiniuj katalog, w którym przechowywany jest plik PDF. Informuje to program, gdzie ma zlokalizować plik PDF.

string dataDir = "YOUR DOCUMENT DIRECTORY";

Pamiętaj o wymianieYOUR DOCUMENT DIRECTORY z rzeczywistą ścieżką.

Krok 2: Otwórz dokument PDF

Użyj biblioteki Aspose.PDF, aby otworzyć dokument PDF:

Document pdfDocument = new Document(dataDir + "GetAlltheAttachments.pdf");

Sprawdź, czy ścieżka i nazwa pliku są prawidłowe.

Krok 3: Uzyskaj dostęp do kolekcji plików osadzonych

Aby uzyskać dostęp do załączników w formacie PDF, pobierz kolekcję osadzonych plików:

EmbeddedFileCollection embeddedFiles = pdfDocument.EmbeddedFiles;

Krok 4: Policz osadzone pliki

Przydatna jest informacja o liczbie obecnych załączników:

Console.WriteLine("Total files : {0}", embeddedFiles.Count);

Krok 5: Przejrzyj załączniki

Wyodrębnij szczegóły każdego załącznika za pomocą pętli:

int count = 1;

foreach (FileSpecification fileSpecification in embeddedFiles)
{
    Console.WriteLine("Name: {0}", fileSpecification.Name);
    Console.WriteLine("Description: {0}", fileSpecification.Description);
    Console.WriteLine("Mime Type: {0}", fileSpecification.MIMEType);

Krok 6: Wyodrębnij dodatkowe parametry pliku

W przypadku załączników z dodatkowymi parametrami możesz sprawdzić i wydrukować następujące szczegóły:

if (fileSpecification.Params != null)
{
    Console.WriteLine("CheckSum: {0}", fileSpecification.Params.CheckSum);
    Console.WriteLine("Creation Date: {0}", fileSpecification.Params.CreationDate);
    Console.WriteLine("Modification Date: {0}", fileSpecification.Params.ModDate);
    Console.WriteLine("Size: {0}", fileSpecification.Params.Size);
}

Krok 7: Wypakuj i zapisz załączniki

Na koniec zapiszmy każdy wyodrębniony załącznik do pliku:

byte[] fileContent = new byte[fileSpecification.Contents.Length];
fileSpecification.Contents.Read(fileContent, 0, fileContent.Length);

using (FileStream fileStream = new FileStream(dataDir + count + "_out" + ".txt", FileMode.Create))
{
    fileStream.Write(fileContent, 0, fileContent.Length);
}
count += 1;

Ten kod odczytuje zawartość każdego załącznika do tablicy bajtów i zapisuje ją w nowym pliku tekstowym, nadając im kolejne nazwy (np.1_out.txt, 2_out.txtitp.).

Wniosek

Gratulacje! Właśnie wyodrębniłeś wszystkie załączniki z pliku PDF za pomocą Aspose.PDF dla .NET. Ta potężna biblioteka upraszcza manipulację dokumentami PDF i sprawia, że dostęp do osadzonych plików jest dziecinnie prosty — nieoceniona umiejętność zarówno w projektach osobistych, jak i w przedsięwzięciach zawodowych.

Najczęściej zadawane pytania

Czym jest Aspose.PDF dla .NET?

Aspose.PDF dla platformy .NET to biblioteka przeznaczona dla programistów, umożliwiająca programistyczne tworzenie, edytowanie i konwertowanie dokumentów PDF.

Czy istnieje bezpłatna wersja próbna Aspose.PDF?

Tak, Aspose udostępnia bezpłatną wersję próbną, której możesz użyć do eksploracji jej funkcji. Uzyskaj do niej dostępTutaj.

Gdzie mogę uzyskać pomoc techniczną dotyczącą Aspose.PDF?

Pomoc jest dostępna na forum Aspose, które znajdzieszTutaj.

Czy mogę uzyskać tymczasową licencję?

Tak, możesz poprosić o tymczasową licencję na Aspose.PDFTutaj.

Gdzie mogę znaleźć dokumentację dla Aspose.PDF?

Można znaleźć kompleksową dokumentację Aspose.PDF dla .NETTutaj.