Из ПДФ в эксель

Как преобразовать обычный текстовый файл в CSV-файл и импортировать его в Excel?

Что вам нужно, это не Excel. Excel и Calc (OO.o) могут открывать CSV в виде электронных таблиц, но то, что вы хотите, — это что-то, что можно манипулировать текстовым файлом в файл CSV с правильным форматированием.

Для этого вам нужен хороший текстовый редактор. Существует очень мало текстовых редакторов, которые позволяют выполнять многострочный поиск и замену (не знаю, почему, так как это невероятно полезная функция и легко реализуется). Но очень хороший бесплатный редактор, который ( sorta ) имеет эту функциональность, Notepad2 . Это, в основном, обновленная версия Windows по умолчанию Notepad, но не такая громоздкая, как Notepad ++. Вы можете заменить Блокнот Windows Notepad2 или Notepad ++, но это выходит за рамки этого ответа.

После установки Notepad2:

  1. Откройте текстовый файл и нажмите Ctrl + H , чтобы открыть find & amp; заменить диалог.
  2. Введите запятую или запятую и пробел в поле Search String .
  3. Теперь вы заметите, что поле Replace with: является только однострочным. Это нормально, потому что Notepad2 поддерживает regex прямо из коробки. Поэтому установите флажок Regular expression search .
  4. Несмотря на то, что приведенный выше флажок установлен, на самом деле это Поиск регулярных выражений и замена -meaning, что вы можете использовать регулярные выражения в поле Replace . Итак, введите \n и нажмите Replace All .
  5. Затем просто сохраните как * .csv и закройте. Если вы откроете его в Excel / Calc, теперь он должен быть столбцом имен / сообщений электронной почты.

Собственно, перечитывая свой вопрос, мне кажется, что вам может понадобиться 2 столбца: 1 для электронной почты, один для имени. Если это так, то это немного сложнее, чем просто заменить все запятые на перерывы. Но не бойся! Регулярные выражения помогут вам еще раз:

  1. Откройте исходный текстовый файл.
  2. Поднимите поиск & amp; заменить диалог.
  3. Введите это в поле поиска: \(+\),\(+\),
  4. Введите это в поле замены: ,\n
  5. Hit Replace All .
  6. Сохранить как * .csv и выйти.

Вы можете по желанию изменить регулярные выражения, чтобы поместить пробел после запятых, если это то, как форматируется текстовый файл или как вы хотите отформатировать его, например.

first last, user@domain.com, bob builder, bob@builder.com, foo… versus: first last,user@domain.com,bob builder,bob@builder.com,foo…

Для Notepad ++ аромата регулярного выражения вам не нужно избегать группировок с обратными косыми чертами, поэтому соответствующее регулярное выражение поиска будет:

(+),(+),

Если есть пустые адреса электронной почты:

(+),(*), // assuming that the email is the second parameter (*),(+), // make the first parameter optional

Чтобы справиться с полностью отсутствующими полями, он становится немного грязным. Это связано с тем, что ни Notepad2, ни Notepad ++ не поддерживают дополнительные группы или отрицательные lookbehinds. Поэтому нам нужно применить 2 разных регулярных выражения:

  1. Это принимает все последовательные электронные письма и вводит пустое поле ( , , ) между ними. Запустите это (с Replace All ) несколько раз, пока не перестанете получать совпадения.:

    (+@+), (+@+),* // search for , , , // replace

  2. Вручную добавьте дополнительное пустое поле в начале или в конце документа, если это необходимо.

  3. В зависимости от того, приходит ли электронное письмо первым или имя приходит первым, замените его:

    (+), (*),\s // email first (*), (+),\s // name first

    с:

    , \n

И это должно сделать это. \s выше — это просто символ пробела. Вы можете либо разместить там пробел, либо написать \s в регулярном выражении.

Примечание. Обычно я стараюсь не просить человека установить новый редактор текста / графики / аудио / видео только для решения конкретной проблемы, но это один из примеров, когда: 1.) это очень легкий ( ~ 300 КБ) бесплатная программа, которую я знаю работает; 2.) это невероятно полезно, и почти любой, кто еще не установил замену блокнота, например Notepad2 / Notepad ++, выиграл бы от его установки. Фактически, я устанавливаю его на каждый компьютер Windows, который я использую, а также каждую рабочую станцию Windows на моей работе.

PDF на сегодняшний день один из самых популярных форматов для чтения. Но, с данными в этом формате не очень удобно работать. Перевести же его в более удобные форматы, предназначенные для редактирования данных, не так просто. Зачастую, при использовании различных инструментов для конвертации, при переводе из одного формата в другой наблюдается потеря информации, или она отображается в новом документе некорректно. Давайте разберем, как можно конвертировать файлы PDF в форматы поддерживаемые программой Microsoft Excel.

Конвертация с помощью приложений для чтения PDF

Одной из самых популярных программ для чтения файлов в формате PDF является приложение Adobe Acrobat Reader. Воспользовавшись его инструментарием, можно совершить часть процедуры по переводу PDF в Excel. Вторую половину данного процесса нужно будет выполнить уже в самой программе Microsoft Excel.

Открываем файл PDF в программе Acrobat Reader. Если данная программа установлена по умолчанию для просмотра файлов формата PDF, то это можно сделать, просто кликнув по файлу. Если же программа не установлена по умолчанию, то можно воспользоваться функцией в меню проводника Windows «Открыть с помощью».

Также, можно запустить программу Acrobat Reader, и в меню этого приложения перейти по пунктам «Файл» и «Открыть».

Запустится окно, где нужно выбрать файл, который собираетесь открыть, и нажать на кнопку «Открыть».

После того, как документ открыт, опять нужно кликнуть по кнопке «Файл», но на этот раз перейти по пунктам меню «Сохранить как другой» и «Текст…».

В открывшемся окне, следует выбрать директорию, где файл в формате txt будет храниться, а затем нажать на кнопку «Сохранить».

На этом программу Acrobat Reader можно закрывать. Далее, открываем сохраненный документ в любом текстовом редакторе, например в стандартном Блокноте Windows. Копируем весь текст, или ту часть текста, которую желаем вставить в файл Excel.

После этого, запускаем программу Microsoft Excel. Кликаем правой кнопкой мыши на верхнюю левую ячейку листа (A1), и в появившемся меню, выбираем пункт «Вставить…».

Далее, кликнув по первому столбцу вставленного текста, переходим во вкладку «Данные». Там, в группе инструментов «Работа с данными» кликаем по кнопке «Текст по столбцам». Нужно отметить, что при этом, один из столбцов, содержащий перенесенный текст, должен быть выделен.

Затем, открывается окно Мастера текстов. В нём, в разделе под названием «Формат исходных данных» нужно удостовериться, чтобы переключатель стоял в позиции «с разделителями». Если это не так, то следует переставить его в нужную позицию. После этого, жмем на кнопку «Далее».

В перечне символов-разделителей устанавливаем галочку напротив пункта «пробел», а напротив всех остальных пунктов галочки снимаем.

В открывшемся окне, в блоке параметров «Формат данных столбца» нужно установить переключатель в позицию «Текстовый». Напротив надписи «Поместить в» указываем любой столбец листа. Если вы не знаете, как прописать его адрес, то просто кликните по кнопке рядом с формой ввода данных.

При этом, Мастер текстов свернется, а вам вручную нужно будет кликнуть по тому столбцу, который собираетесь указать. После этого, его адрес появится в поле. Вам же остается только кликнуть по кнопке справа от поля.

Опять открывается Мастер текстов. В данном окне все настройки введены, поэтому кликаем по кнопке «Готово».

Подобную операцию следует проделать с каждым столбцом, который был скопирован из документа PDF на лист Excel. После этого, данные будут упорядочены. Их осталось только сохранить стандартным способом.

Конвертация через онлайн-сервисы

Для конвертации через онлайн-сервисы вообще не нужно скачивать никакого дополнительного программного обеспечения. Одним из самых популярных подобных ресурсов является Smallpdf. Этот сервис предназначен для конвертации файлов PDF в различные форматы.

После того, как вы перешли в раздел сайта, на котором производится конвертация в Excel, просто перетяните требуемый файл PDF из проводника Windows в окно браузера.

Можно также нажать на надпись «Выберите файл».

После этого, запустится окно, в котором нужно отметить требуемый файл PDF, и нажать на кнопку «Открыть».

Происходит загрузка файла на сервис.

Затем, онлайн-сервис конвертирует документ, и в новом окне предлагает скачать стандартными инструментами браузера файл в формате Excel.

После скачивания, он будет доступен для обработки в программе Microsoft Excel.

Итак, мы рассмотрели три основных способа преобразования файлов PDF в документ Microsoft Excel. Нужно отметить, что ни один из описанных вариантов не гарантирует того, что данные будут полностью корректно отображены. В большинстве случаев, предстоит ещё редактирование нового файла в программе Microsoft Excel, для того, чтобы данные корректно отображались, и имели презентабельный вид. Впрочем, это все равно намного проще, чем полностью перебивать данные из одного документа в другой вручную.

Мы рады, что смогли помочь Вам в решении проблемы.
Отблагодарите автора, поделитесь статьей в социальных сетях.
Опишите, что у вас не получилось. Наши специалисты постараются ответить максимально быстро.

Как преобразовать PDF в Excel встроенными средствами

Воспользуемся программой Acrobat Reader и функцией Office «Текст по столбцам». Если у вас нет Acrobat Reader, зайдите на официальный сайт и скачайте.

Нажмите на кнопку «Загрузить бесплатно».

Если вам не нужен MacAfee (антивирус), снимите галочки в среднем окне. Щелкните на «Установить сейчас».

Дождитесь, когда скачается и установите программу.

Откройте документ в установленном ПО и сохраните как текст. Для этого выберите меню «Файл», «Сохранить как другой», «Текст».

Нажмите кнопку «Сохранить». Документ будет сохранен в виде текста.

Откройте текстовый файл в блокноте, выделите все (CTRL+A) и скопируйте в буфер (CTRL+C).

Откройте программу, создайте новую книгу и в первую ячейку вставьте текст (CTRL+V).

Затем поставьте указатель на ячейку A1 и перейдите на вкладку «Данные». Там нажмите кнопку «Текст по столбцам».

Выберите пункт «С разделителями» и щелкните «Далее».
В качестве разделителя выберите пробел или любой другой, если в вашем документе иначе. Опять жмем «Далее».
Формат лучше оставить общий. Нажимайте «Готово».
Результат далек от совершенства, но небольшую таблицу можно поправить вручную.
Попробуем перевести файл PDF в Excel формат, воспользовавшись другой командой Acrobat Reader. Сохраняя документ в другом виде, выберите команду «Word или Excel онлайн». Вам понадобится подключение к сети.
К сожалению, пока перевод возможен только в Word и отсутствует русский язык. Так что таким способом конвертировать PDF в Excel не получится.

Онлайн конвертер PDF в Excel

Существует множество сервисов, позволяющих это сделать. Попробуем несколько и сравним результаты.

В этом сервисе для загрузки нужно нажать кнопку «Обзор».
После недолгого ожидания можно скачать.
В результате получаем адекватную таблицу на двух листах.

Файл можно просто перетянуть на поле сервиса.
После чего можно сразу скачивать.
Результат представлен на двух листах, но зато в виде таблицы, практически идентичной таблице из оригинала.

Удобно, что файл можно просто перетащить в окно сервиса.
Затем нажмем кнопку «Преобразовать».
Конвертация PDF в Excel выполняется быстро. Нажмем скачать, чтобы получить документ.
Как видим, все данные расположены в одном столбце. Приведение таблицы в нормальный вид займет достаточно много времени.

Этот сервис не дает перетаскивать файл. Нужно нажать кнопку «Выберите файл».
Ищем файл в системе и выделяем его. Далее надо нажать «Открыть».
После конвертации появилась возможность скачать.
Результат идентичен.
Этот способ перевода из PDF в Excel также не самый идеальный. Единственное облегчение – не нужно заново все печатать, а можно будет обойтись копированием и вставкой. Но для больших таблиц это затратно по времени.
Можно сказать, что большинство сервисов вполне удовлетворительно справились с такой задачей, как из PDF сделать Excel, однако первые два — фавориты.

Как перевести и скопировать таблицу из PDF в Excel — программы

Большей частью программное обеспечение для этих целей платное. Приведем краткий обзор некоторых.

ABBYY PDF Transformer+

Скачать за 5990 р. можно здесь.

Это лицензионный продукт, полностью направленный на работу с документами. Помимо всего прочего, ПО позволяет и перевод в различные форматы. Удобна тем, что можно просто выделить текст и скопировать в любую программу, например, Word или Excel.

Pdfexcelconverter

Это условно бесплатный продукт, который необходимо инсталлировать на компьютер.
Нажмите на «+», чтобы загрузить файл.
Начинаем конвертацию.
И получаем предложение зарегистрироваться. В бесплатной версии конвертируется только первая страница. Результат тоже не впечатляет.

Total pdf converter

Еще одна условно-бесплатная программа. После установки мы можем открыть в ней файл и конвертировать его в любой формат.
Как в ней сохранить экспорт PDF в Excel? Просто указать нужную папку.
После конвертации в указанной папке появляется файл. Таблица вполне узнаваема, но в бесплатной версии распознается только первая страница.

Able2extract

Условно-бесплатная программа, открытая для свободного скачивания. Лицензия стоит 150 долларов.
Удобно, то что каждый шаг сопровождается подсказкой.
В условно-бесплатной версии вы не сможете выполнить никаких действий, кроме как открыть файл.

Макрос для импорта из PDF в Excel невозможно написать, так как этот формат больше относится к графическому типу. Здесь необходимо пользоваться программами распознавания текста. А вот конвертировать из .xls в него вполне возможно и программным путем, так как Office имеет соответствующую надстройку.
В заключение можем отметить, что самый простой и надежный вариант распознать текст из PDF в Excel для единичных случаев – использование онлайн сервисов. Если вы конвертируете большой объем документов, то имеет смысл купить лицензионное ПО.