скопировать таблицу из pdf в виде таблицы?

Как я могу скопировать или экспортировать таблицу из документа PDF в Word, Excel, OneNote и т. д. в виде таблицы вместо обычного текста?

Пример pdf: ftp://ftp2.cits.rncan.gc.ca/pub/canvec/doc/CanVec_transition_guide_en.pdf, начиная со страницы 9. Я использую Office 2003, пробную версию OneNote 2007.


Вы можете попробовать Tabula — очень хорошо работает для содержимого, ориентированного на данные, размещенного в таблицах.

Краткое введение можно найти на домашнюю страницу.

Используя инструмент для PDF-файла, прикрепленного к этому вопросу, вы должны:

  1. Загрузить файл на свой локальный диск.
  2. Установите и запустите инструмент, следуя инструкциям на домашней странице.
  3. Загрузите PDF-файл и выберите Отправить .
  4. Перейдите к первой таблице и выберите ее. Убедитесь, что вы не выбрали верхний и нижний колонтитулы страницы, чтобы получить более точный результат.
  5. Выберите Повторить этот выбор , если вы хотите выбрать следующие таблицы с теми же координатами.
  6. Выберите Загрузить все данные и вы получите.
  7. Выберите Загрузить данные , чтобы получить CSV файл с извлеченными таблицами. Этот файл можно открыть с помощью MS Excel или любого другого приложения, которое может считывать формат CSV для дальнейшей обработки.

6

Вы можете использовать программу просмотра документов Okular, доступную в Linux и Windows, через http://windows.kde.org/установщик.

Он может выделять текст как таблицу, где вы можете определять строки и столбцы.

Поделиться
Улучшить этот ответ
ответил 22 августа 2012, 11:29
добавить комментарий |

Вы можете использовать программу просмотра документов Okular, доступную в Linux и Windows через http://windows.kde.org/установщик.

Он может выбирать текст в виде таблицы, в которой вы можете определять строки и столбцы.


5

MirzaD, спасибо за предложение Okular. Я установил его на свой рабочий стол ubuntu и никогда не воспринимал его всерьез … до сих пор. Спасибо тебе.

Okular великолепен в том, что он включает в себя, и, безусловно, может удовлетворить потребности человека, задающего вопрос. В Okular вы используете Инструмент выбора таблицы и определяете область, а затем щелкаете границы столбца, чтобы отметить поля … и затем копировать. Когда вы вставляете его, вы получаете согласованный вывод с разделителями-табуляциями, который можно уговорить обработать любой серьезный инструмент как файл CSV..

У меня есть эта потребность (для извлечения нескольких таблиц из документа PDF) сейчас на рабочем столе Centos с запущенным gnome/xfce, и установка okular означала бы установку целого ряда других графических инструментов KDE. Итак, я сначала попробую с tabula (что тоже выглядит очень многообещающим), и если это не удастся, тогда все должно быть нормально.

Будет ли это работать для Windows? Да, KDE можно установить в Windows, но приложения KDE имеют приличную нагрузку на другое ненужное программное обеспечение. Так что, это зависит от того, насколько велики ваши потребности, это может быть приемлемым вариантом даже для Windows.

Узнайте больше об Okular здесь … и их слоган More Than a Reader , безусловно, подходит … Я действительно впечатлен тем, что может сделать Okular … в аккуратном и достаточно быстром приложении с небольшой размер.

Проект KDE Windows … упрощает установку подмножества отличных приложений KDE в окнах.

Поделиться
Улучшить этот ответ
отредактировано 22 апреля ’14 в 3:56
ответил 22 апреля ’14 в 3:48
  • +1 за правильную ссылку (okular.kde.org). — Родриго 03 фев. 2017, в 2:32
добавить комментарий |

MirzaD, спасибо за предложение Okular. Я установил его на свой рабочий стол ubuntu и никогда не воспринимал его всерьез … до сих пор. Спасибо тебе.

Okular великолепен в том, что он включает в себя, и, безусловно, может удовлетворить потребности человека, задающего вопрос. В Okular вы используете Инструмент выбора таблицы и определяете область, а затем щелкаете границы столбца, чтобы отметить поля … и затем копировать. Когда вы вставляете его, вы получаете согласованный вывод с разделителями табуляцией, который можно уговорить обработать любой серьезный инструмент как файл CSV.

У меня есть такая потребность (чтобы извлечь несколько таблиц из документа PDF. ) теперь на рабочем столе Centos с запущенным gnome/xfce, и установка okular означала бы установку целого ряда других графических инструментов KDE. Итак, я сначала попробую с tabula (что тоже выглядит очень многообещающим), и если это не удастся, тогда все должно быть нормально.

Будет ли это работать для Windows? Да, KDE можно установить в Windows, но приложения KDE имеют приличную нагрузку на другое ненужное программное обеспечение. Так что, это зависит от того, насколько велики ваши потребности, это может быть приемлемым вариантом даже для Windows.

Узнайте больше об Okular здесь … и их слоган More Than a Reader , безусловно, подходит … Я действительно впечатлен тем, что может сделать Okular … в аккуратном и достаточно быстром приложении с небольшой размер.

Проект KDE Windows .. упрощает установку подмножества отличных приложений KDE в Windows.


2

Откройте документ с помощью Adobe Acrobat. Щелкните Файл> Сохранить как. Выберите «HTML 4.01 с CSS 1.0 (* .htm, * .html)» в «Сохранить как тип», затем сохраните.

Затем вы можете открыть сохраненный HTML-файл в Microsoft Word, и он будет отображаться в виде таблицы вместо обычного текста.

Поделиться
Улучшите этот ответ
ответил 09 июля ’10 в 0:36
  • 1
    Это хороший ответ для людей, купивших Acrobat. Есть предложения для тех, у кого его нет? Сохранить как другой тип недоступен в Adobe Reader. — Мэтт Уилки, 09 июля 2010, 15:58
  • 1
    Будет ли OpenOffice отображать таблицы при открытии документа PDF в качестве бесплатной альтернативы? — Арсений Мурзенко 09 июл., 2010 в 20:20
добавить комментарий |

Откройте документ с помощью Adobe Acrobat. Щелкните Файл> Сохранить как. Выберите «HTML 4.01 с CSS 1.0 (* .htm, * .html)» в «Сохранить как тип», затем сохраните.

Затем вы можете открыть сохраненный HTML-файл в Microsoft Word, и он будет отображаться как таблица вместо обычного текста.


2

www.freepdftoword.org — бесплатный онлайн-сервис. Надежно справляется с созданием настоящих объектов таблиц в Word.

Поделиться
Улучшить этот ответ
ответил 9 июля ’10 в 20:19
  • Спасибо. Он отлично работал с параметрами по умолчанию и не имел проблемы с лишними строками, как единственный другой успешный онлайн-конвертер. — Мэтт Вилки 09 июл., 2010 в 20:39
добавить комментарий |

www.freepdftoword.org — бесплатный онлайн-сервис. Надежно справляется с созданием настоящих объектов таблиц в Word.


1

Это сложный вопрос. Если у вас есть средства, самым простым решением будет связаться с человеком, создавшим PDF-файл. Скорее всего, они сделали это из файла .doc. Если вы можете получить оригинал, у вас есть то, что вам нужно, без необходимости преобразования.

Поделиться
Улучшите это ответ
Создан 09 июля ’10 в 19: 432010-07-09 19:43
  • + 1. Кстати, копирование содержимого из PDF-документа (и его редактирование?) Может быть запрещено, если документ защищен авторским правом. Так что обращение к автору, безусловно, лучшее решение. — Арсений Мурзенко 09 июл., 2010 в 20:22
добавить комментарий |

Это сложный вопрос. Если у вас есть средства, самым простым решением будет связаться с человеком, создавшим PDF-файл. Скорее всего, они сделали это из файла .doc. Если вы можете получить оригинал, у вас есть то, что вам нужно, без необходимости преобразования.


1

Связанные вопросы и ответы, по-видимому, удалены: https://stackoverflow.com/questions/488089/extracting-tables-from-pdf-files-programmatically/857800 (см. кешированную версию: http://webcache.googleusercontent.com/search?q=cache:9I328EN_d64J:stackoverflow.com/questions/488089/extracting-tables-from-pdf-files-programmatically/857800+&cd=1&hl=en&ct = clnk & gl = ch).

Ниже моего ответа еще раз подтверждаю, что Okular — отличный выбор для быстрой отмены.

Для быстрого (одиночные -?) таблицы, стоит попробовать отличный инструмент выбора таблиц Okular.

  1. Откройте файл PDF и найдите нужную таблицу
  2. активируйте Инструмент выбора таблицы с помощью Ctrl+5
  3. доктор aw прямоугольную область, чтобы заключить таблицу
  4. наконец, и, если требуется, определите вертикальное и горизонтальное деление ячеек таблицы щелкая по краям (возможно, вам придется немного поиграть, чтобы понять идею — см. снимок экрана ниже).

Вуаля! Скопируйте и вставьте, например, в пустую таблицу.

Поделиться
Улучшите это ответ
изменено 23 мая ’17 в 12:41
Сообщество ♦
1
ответил 9 мая ’16 в 9:47
добавить комментарий |

Связанные вопросы и ответы были, по-видимому, удалены: https://stackoverflow.com/questions/488089/extracting -tables-from-pdf-files-программно/857800 (см. кешированную версию: http://webcache.googleusercontent.com/search?q=cache:9I328EN_d64J:stackoverflow.com/questions/488089/extracting-tables-from-pdf -files-programmatic/857800 + & cd = 1 & hl = en & ct = clnk & gl = ch).

Под моим ответом еще раз подтверждаю, что Okular — отличный выбор для быстрой отмены.

Для быстрого (одиночного -?) извлечения (ов) таблиц стоит проверить отличный инструмент выбора таблиц Okular.

  1. Откройте файл PDF-файл и найдите нужную таблицу.
  2. активируйте Инструмент выбора таблицы с помощью Ctrl + 5
  3. нарисуйте прямоугольную область, чтобы заключить таблицу.
  4. наконец, и, если необходимо, определите vertical и горизонтальное деление ячеек таблицы щелчком по краям (возможно, потребуется d, чтобы немного поиграть, чтобы понять идею — см. снимок экрана ниже).

Вуаля! Скопируйте и вставьте, например, в пустую электронную таблицу.


0

Мне не нравится добавлять дополнительное программное обеспечение или отправлять свои данные на внешний сайт для их преобразования. Обычно из-за временного аспекта!

Но в PDF-файлах вы можете выбирать данные в столбцах, удерживая Alt и перетаскивая, пока ваша таблица не огромна (т.е. вам придется делать это для каждый столбец). Просто скопируйте и вставьте каждое в слово.

Не идеально, но работает без необходимости устанавливать что-либо дополнительно!

Поделиться
Улучшить этот ответ
ответил 22 августа ’12 в 11:37
добавить комментарий |

Мне не нравится добавлять дополнительное программное обеспечение или отправлять свои данные на внешний сайт для их преобразования. Обычно из-за временного аспекта!

Но в PDF-файлах вы можете выбирать данные в столбцах, удерживая Alt и перетаскивая, пока ваша таблица не огромна (т.е. вам придется делать это для каждый столбец). Просто скопируйте и вставьте каждое в слово.

Не идеально, но работает без необходимости устанавливать что-либо дополнительно!


0

Мне удалось успешно скопировать данные таблицы через буфер обмена из Foxit PDF Reader непосредственно в MS Word, Excel и Atlassian Conflunce.

Поделиться
Улучшите это ответ
ответ дан 15 апр ’19 в 12:47
добавить комментарий |

Мне удалось успешно скопировать данные таблицы через буфер обмена из Foxit PDF Reader непосредственно в MS Word, Excel и Atlassian Conflunce.

Оцените статью
Botgadget.ru
Добавить комментарий