Indexing your office documents with Elastic and FSCrawler

Indexing your office documents with Elastic and FSCrawler
You have plenty of Open Office, Microsoft Office, PDF, image documents and you may want to be able to search for their metadata and content. How can you do that?
In this talk, David will explain how Apache Tika can be used for that and how to combine this fantastic library with Elastic Stack:
- Elasticsearch ingest-attachment plugin
- FSCrawler
Title
Indexing your office documents with Elastic and FSCrawlerAbstract
You have plenty of Open Office, Microsoft Office, PDF, image documents and you may want to be able to search for their metadata and content. How can you do that?
In this talk, David will explain how [Apache Tika](https://tika.apache.org/) can be used for that and how to combine this fantastic library with Elastic Stack:
* Elasticsearch [ingest-attachment plugin](https://www.elastic.co/guide/en/elasticsearch/plugins/current/ingest-attachment.html)
* [FSCrawler](https://github.com/dadoonet/fscrawler)
Indexer ses documents bureautique avec la suite Elastic et FSCrawler
Vous avez sous la main des tonnes de documents Open Office, Microsoft Office, PDF voire des images… Et vous aimeriez être capable de chercher dans leurs meta-données et dans le contenu lui-même.
Comment faire ? Surtout depuis l’annonce de la fin de Google Search Appliance.
Dans cette session, David expliquera comment Apache Tika peut fournir ce service et comment combiner cette fantastique librairie avec elasticsearch :
- Elasticsearch ingest-attachment plugin
- FSCrawler
Title
Indexer ses documents bureautique avec la suite Elastic et FSCrawlerAbstract
Vous avez sous la main des tonnes de documents Open Office, Microsoft Office, PDF voire des images… Et vous aimeriez être capable de chercher dans leurs meta-données et dans le contenu lui-même.
Comment faire ? Surtout depuis l’annonce de la fin de Google Search Appliance.
Dans cette session, David expliquera comment [Apache Tika](https://tika.apache.org/) peut fournir ce service et comment combiner cette fantastique librairie avec elasticsearch :
* Elasticsearch [ingest-attachment plugin](https://www.elastic.co/guide/en/elasticsearch/plugins/current/ingest-attachment.html)
* [FSCrawler](https://github.com/dadoonet/fscrawler)
Resources
Useful resources related to this talk.














