Facturatie
Factuur-OCR en -parsing
Hoe Financica gegevens uit geüploade facturen haalt met behulp van OCR.
Wanneer u een PDF of afbeelding van een factuur uploadt, gebruikt Financica optische tekenherkenning (OCR) om automatisch de belangrijkste gegevens te extraheren. Zo hoeft u factuurgegevens niet handmatig in te voeren.
Wat wordt er geëxtraheerd
De OCR-engine herkent en extraheert:
- Leverancier- of klantnaam - Het bedrijf dat de factuur heeft uitgereikt of ontvangen.
- Factuurnummer - Het referentienummer op de factuur.
- Factuurdatum - Wanneer de factuur is uitgereikt.
- Vervaldatum - Wanneer de betaling wordt verwacht.
- Factuurregels - Afzonderlijke producten of diensten met omschrijvingen, hoeveelheden en prijzen.
- Subtotalen en totalen - Inclusief eventuele toegepaste kortingen.
- Btw-gegevens - Btw-tarieven en btw-bedragen per factuurregel en in totaal.
- Betalingsinformatie - Bankrekeninggegevens of betalingsreferenties, indien beschikbaar.
Hoe het proces werkt
- Uploaden - U uploadt een PDF- of afbeeldingsbestand vanuit het kosten- of opbrengstengedeelte.
- Verwerking - Het bestand wordt naar de OCR-engine gestuurd voor analyse. Dit duurt doorgaans enkele seconden.
- Controle - De geëxtraheerde gegevens worden ter controle aangeboden. Velden waarover de engine minder zeker was, kunnen worden gemarkeerd.
- Corrigeren en opslaan - Breng eventuele correcties aan en sla het factuurrecord op.
Tips voor betere OCR-resultaten
- Gebruik scans van hoge kwaliteit - Duidelijke, goed belichte afbeeldingen leveren betere resultaten op dan wazige foto's.
- PDF heeft de voorkeur - Native PDF-bestanden (geen ingescande afbeeldingen opgeslagen als PDF) geven de beste resultaten, omdat de tekst al machineleesbaar is.
- Standaardlayouts - Facturen met een conventionele lay-out worden nauwkeuriger verwerkt dan sterk gestileerde ontwerpen.
- Eén factuur per bestand - Upload elke factuur als een apart bestand voor de schoonste resultaten.
Ondersteunde bestandsformaten
- PDF (native en ingescand)
- PNG- en JPG-afbeeldingen
- HEIC-foto's (van iPhone-camera's)
Hybride PDF's met ingesloten factuurgegevens
Sommige PDF's bevatten de factuurgegevens twee keer: als visueel document en als gestructureerd XML-bestand dat in het bestand is ingesloten. De Factur-X-standaard (in Duitsland ZUGFeRD genoemd) is het meest voorkomende formaat. Wanneer u zo'n PDF uploadt, leest Financica direct het ingesloten XML en slaat OCR volledig over. Het resultaat is hetzelfde als bij een UBL-factuur: elk veld wordt met 100% nauwkeurigheid geëxtraheerd.
U hoeft niets te doen om dit te activeren - de detectie gebeurt automatisch. Als het ingesloten XML niet gelezen kan worden (oudere of niet-conforme varianten), valt het systeem terug op OCR.
Wanneer OCR niet volstaat
Voor facturen waarmee OCR moeite heeft (handgeschreven, ongebruikelijke lay-outs of zeer slechte kwaliteit) kunt u de gegevens altijd handmatig invoeren. De OCR-extractie is een startpunt, geen vereiste. Elk veld kan worden bewerkt.
Voor gestructureerde elektronische facturen (UBL XML of Factur-X / ZUGFeRD) is helemaal geen OCR nodig. Zie Elektronische facturatie.