Получить все вложения из PDF-файлов

Введение

В нашем цифровом мире файлы PDF необходимы для обмена документами — они универсальны, безопасны и могут содержать различные типы информации, включая встроенные вложения. Вам когда-нибудь нужно было извлечь эти скрытые драгоценности из PDF? Вы в правильном месте! В этом руководстве мы рассмотрим, как использовать Aspose.PDF для .NET для извлечения всех вложений из файла PDF. Независимо от того, являетесь ли вы опытным разработчиком или только начинаете, это руководство проведет вас через процесс шаг за шагом.

Предпосылки

Прежде чем углубляться в код, убедитесь, что у вас есть следующее:

  1. Visual Studio: убедитесь, что она установлена на вашем компьютере.
  2. Aspose.PDF для .NET: Загрузите и установите библиотеку сздесь.
  3. Базовые знания C#: знакомство с программированием на C# поможет вам легче понимать фрагменты кода.

Настройка вашей среды

Чтобы начать работу, выполните следующие действия по настройке проекта C#:

Создать новый проект

Откройте Visual Studio и создайте новый проект консольного приложения.

Добавить ссылку Aspose.PDF

  • Щелкните правой кнопкой мыши по вашему проекту в обозревателе решений.
  • Выберите «Управление пакетами NuGet».
  • Найдите «Aspose.PDF» и установите последнюю версию.

Импорт требуемых пространств имен

В верхней части файла программы импортируйте необходимые пространства имен:

using System.IO;
using Aspose.Pdf;
using System;

Теперь, когда все настроено, давайте займемся извлечением вложений из PDF-файла.

Шаг 1: Укажите каталог документов

Определите каталог, в котором хранится ваш PDF-файл. Это сообщит программе, где найти ваш PDF-файл.

string dataDir = "YOUR DOCUMENT DIRECTORY";

Обязательно заменитеYOUR DOCUMENT DIRECTORY с реальным путем.

Шаг 2: Откройте PDF-документ.

Используйте библиотеку Aspose.PDF, чтобы открыть ваш PDF-документ:

Document pdfDocument = new Document(dataDir + "GetAlltheAttachments.pdf");

Убедитесь, что путь к файлу и его имя указаны правильно.

Шаг 3: Получите доступ к коллекции встроенных файлов

Чтобы получить доступ к вложениям в PDF-файле, извлеките коллекцию встроенных файлов:

EmbeddedFileCollection embeddedFiles = pdfDocument.EmbeddedFiles;

Шаг 4: Подсчитайте количество встроенных файлов

Полезно знать, сколько имеется вложений:

Console.WriteLine("Total files : {0}", embeddedFiles.Count);

Шаг 5: Просмотрите вложения

Извлеките сведения о каждом вложении с помощью цикла:

int count = 1;

foreach (FileSpecification fileSpecification in embeddedFiles)
{
    Console.WriteLine("Name: {0}", fileSpecification.Name);
    Console.WriteLine("Description: {0}", fileSpecification.Description);
    Console.WriteLine("Mime Type: {0}", fileSpecification.MIMEType);

Шаг 6: Извлечение дополнительных параметров файла

Для вложений с дополнительными параметрами вы можете проверить и распечатать следующие данные:

if (fileSpecification.Params != null)
{
    Console.WriteLine("CheckSum: {0}", fileSpecification.Params.CheckSum);
    Console.WriteLine("Creation Date: {0}", fileSpecification.Params.CreationDate);
    Console.WriteLine("Modification Date: {0}", fileSpecification.Params.ModDate);
    Console.WriteLine("Size: {0}", fileSpecification.Params.Size);
}

Шаг 7: Извлеките и сохраните вложения.

Наконец, сохраним каждое извлеченное вложение в файл:

byte[] fileContent = new byte[fileSpecification.Contents.Length];
fileSpecification.Contents.Read(fileContent, 0, fileContent.Length);

using (FileStream fileStream = new FileStream(dataDir + count + "_out" + ".txt", FileMode.Create))
{
    fileStream.Write(fileContent, 0, fileContent.Length);
}
count += 1;

Этот код считывает содержимое каждого вложения в массив байтов и сохраняет его в новом текстовом файле, присваивая им последовательные имена (например,1_out.txt, 2_out.txt, и т. д.).

Заключение

Поздравляем! Вы только что извлекли все вложения из файла PDF с помощью Aspose.PDF для .NET. Эта мощная библиотека упрощает манипуляции с документами PDF и делает доступ к встроенным файлам легким — бесценный навык как для личных проектов, так и для профессиональных начинаний.

Часто задаваемые вопросы

Что такое Aspose.PDF для .NET?

Aspose.PDF для .NET — это библиотека, предназначенная для разработчиков, позволяющая создавать, изменять и преобразовывать PDF-документы программным способом.

Существует ли бесплатная пробная версия Aspose.PDF?

Да, Aspose предоставляет бесплатную пробную версию, которую вы можете использовать для изучения ее функций. Получить к ней доступздесь.

Как я могу получить поддержку по Aspose.PDF?

Поддержка доступна на форуме Aspose, который вы можете найтиздесь.

Могу ли я получить временную лицензию?

Да, вы можете запросить временную лицензию для Aspose.PDFздесь.

Где я могу найти документацию по Aspose.PDF?

Вы можете найти полную документацию по Aspose.PDF для .NETздесь.