Alle artikelen

Facturatie

Factuur-OCR en -parsing

Hoe Financica gegevens uit geüploade facturen haalt met behulp van OCR.

2 min leestijd

Wanneer u een PDF of afbeelding van een factuur uploadt, gebruikt Financica optische tekenherkenning (OCR) om automatisch de belangrijkste gegevens te extraheren. Zo hoeft u factuurgegevens niet handmatig in te voeren.

Wat wordt er geëxtraheerd

De OCR-engine herkent en extraheert:

  • Leverancier- of klantnaam - Het bedrijf dat de factuur heeft uitgereikt of ontvangen.
  • Factuurnummer - Het referentienummer op de factuur.
  • Factuurdatum - Wanneer de factuur is uitgereikt.
  • Vervaldatum - Wanneer de betaling wordt verwacht.
  • Factuurregels - Afzonderlijke producten of diensten met omschrijvingen, hoeveelheden en prijzen.
  • Subtotalen en totalen - Inclusief eventuele toegepaste kortingen.
  • Btw-gegevens - Btw-tarieven en btw-bedragen per factuurregel en in totaal.
  • Betalingsinformatie - Bankrekeninggegevens of betalingsreferenties, indien beschikbaar.

Hoe het proces werkt

  1. Uploaden - U uploadt een PDF- of afbeeldingsbestand vanuit het kosten- of opbrengstengedeelte.
  2. Verwerking - Het bestand wordt naar de OCR-engine gestuurd voor analyse. Dit duurt doorgaans enkele seconden.
  3. Controle - De geëxtraheerde gegevens worden ter controle aangeboden. Velden waarover de engine minder zeker was, kunnen worden gemarkeerd.
  4. Corrigeren en opslaan - Breng eventuele correcties aan en sla het factuurrecord op.

Tips voor betere OCR-resultaten

  • Gebruik scans van hoge kwaliteit - Duidelijke, goed belichte afbeeldingen leveren betere resultaten op dan wazige foto's.
  • PDF heeft de voorkeur - Native PDF-bestanden (geen ingescande afbeeldingen opgeslagen als PDF) geven de beste resultaten, omdat de tekst al machineleesbaar is.
  • Standaardlayouts - Facturen met een conventionele lay-out worden nauwkeuriger verwerkt dan sterk gestileerde ontwerpen.
  • Eén factuur per bestand - Upload elke factuur als een apart bestand voor de schoonste resultaten.

Ondersteunde bestandsformaten

  • PDF (native en ingescand)
  • PNG- en JPG-afbeeldingen
  • HEIC-foto's (van iPhone-camera's)

Hybride PDF's met ingesloten factuurgegevens

Sommige PDF's bevatten de factuurgegevens twee keer: als visueel document en als gestructureerd XML-bestand dat in het bestand is ingesloten. De Factur-X-standaard (in Duitsland ZUGFeRD genoemd) is het meest voorkomende formaat. Wanneer u zo'n PDF uploadt, leest Financica direct het ingesloten XML en slaat OCR volledig over. Het resultaat is hetzelfde als bij een UBL-factuur: elk veld wordt met 100% nauwkeurigheid geëxtraheerd.

U hoeft niets te doen om dit te activeren - de detectie gebeurt automatisch. Als het ingesloten XML niet gelezen kan worden (oudere of niet-conforme varianten), valt het systeem terug op OCR.

Wanneer OCR niet volstaat

Voor facturen waarmee OCR moeite heeft (handgeschreven, ongebruikelijke lay-outs of zeer slechte kwaliteit) kunt u de gegevens altijd handmatig invoeren. De OCR-extractie is een startpunt, geen vereiste. Elk veld kan worden bewerkt.

Voor gestructureerde elektronische facturen (UBL XML of Factur-X / ZUGFeRD) is helemaal geen OCR nodig. Zie Elektronische facturatie.