Indexer ses documents bureautique avec la suite Elastic et FSCrawler
Snowcamp 2023
Grenoble
🇫🇷France
Jan. 2023
Slides
Abstract
Vous avez sous la main des tonnes de documents Open Office, Microsoft Office, PDF voire des images… Et vous aimeriez être capable de chercher dans leurs meta-données et dans le contenu lui-même.
Comment faire ? Surtout depuis l’annonce de la fin de Google Search Appliance.
Dans cette session, David expliquera comment Apache Tika peut fournir ce service et comment combiner cette fantastique librairie avec elasticsearch :
Elasticsearch ingest-attachment plugin
- Connecteur Workplace Search pour FSCrawler afin de disposer sur étagère d’une interface utilisateur puissante pour vos documents
Resources
The following resources were mentioned during the presentation or are useful additional information.
Demo: FSCrawler
This demo shows how you can use FSCrawler to index your documents
Documentation: FSCrawler
This is the official FSCrawler documentation.
