[gnucash-de] Zurücksetzen des Bayes-Algorithmus

Jörg Schaible joerg.schaible at gmx.de
Di Mai 12 17:31:28 EDT 2020


Hallo Christian,

Du wartest ja noch auf eine Rückmeldung.

Am Mittwoch, 5. Februar 2020, 21:36:35 CEST schrieb Christian Gruber:
> Hallo Jörg,
> 
> ich bin kein Buchführungsexperte, aber gibt es nicht auch manchmal
> Zahlungseingänge, die trotzdem einem Aufwandskonto zuzuordnen sind, z.B.
> Rückbuchungen?

Das macht man IMHO eigentlich nur bei Aktiva-/Passiva-Konten. Bei Aufwandskonten 
sammeln sich nur Ausgaben, bei Ertragskonten die Einnahmen, d.h. eine Zuordnung 
einer Ausgabe auf ein Ertragskonto, bzw. einer Einnahme auf ein Aufwandskonto ist 
eigentlich immer falsch.
 
> Und dann stellt sich mir zunächst die Frage, ob die von dir beobachteten
> falschen Zuordnungen evtl. auf die aktuell existierenden Fehler im
> Bayes-Algorithmus zurückzuführen sind.

Was soll ich bei einem Bayes-Filter sagen, der seit 14 Jahren "trainiert" wird und das auch 
evtl. mit falschen Daten?

> Gibt es bei dir sowohl Aufwands-
> als auch Ertragsbuchungen, die sich im Buchungstext sehr ähnlich sind?

Nun, die Buchungen, die ich bei meiner Bank abhole, sehen ja alle irgendwie so aus:

KARTENZAHLUNG Referenz 601022824208362504 20124952 01603741 Mandat 846897 
Einreicher-ID DE73DAB000000 52684 DANKE, IHR LIDL//Bad Wildba /DE Terminal 
60102282 2020-04-25T12:49:52 Folgenr. 01 Verfalld. 2312; DANKE, IHR LIDL
6,17

KARTENZAHLUNG Referenz 560124363521221504 20154607 Mandat OFFLINE Einreicher-
ID DE53ZZZ000002 57229 PENNY SAGT DANKE 63300247// Villinge n Schwenni/DE 
Terminal 56012436 2020-04-15T15:46:07 Folgenr. 01 Verfalld. 2312; Penny Schwenningen
13,85

KARTENZAHLUNG Referenz 656507000039801504 20114400 Mandat OFFLINE Einreicher-
ID DE65ZZZ000002 10259 VILLINGEN-SCHWENNIN//VILLIN GEN-SCHW ENNI/DE Terminal 
65650700 2020-04-15T11:44:00 Folgenr. 01 Verfalld. 2312; DEUTSCHE POST AG
11,28

Neben den durch Leerzeichen (Zeilenumbruch bei der Übertragung) zerhackten Strings 
besteht jede Zeile aus einem riesigen Haufen Kutter. Der Bayes Filter muss hier also die 
Strings "LIDL", "PENNY" und "Deutsche Post" erkennen, um die ersten beiden einem 
Aufwandskonto "Lebensmittel" zuordnen zu können, bzw. die 3. Buchung zu "Sonstige 
Ausgaben". Dumm nur, dass man bei LIDL dann manchmal auch was anderes als 
Lebensmittel kauft. Da würde ich dann gern beim Import bei einem einzelnen Posten 
manuell zuordnen können, ohne dass der Bayes lernt ganz nach dem Motto "Ignoriere 
das, diesmal ist es eben anders".

Grüße,
Jörg

> 
> Grüße,
> Christian
> 
> Am 02.02.20 um 19:57 schrieb Jörg Schaible:
> > Hallo Christian,
> > 
> > Am Sonntag, 2. Februar 2020, 17:16:46 CET schrieb Christian Gruber:
> >> Der Sinn des Bayes-Algorithmus ist eigentlich, dass man auf das
> >> Erstellen manueller Regeln verzichten kann. Der Algorithmus sollte, wenn
> >> er richtig funktioniert, Buchungen mit Schlagwörtern, die wirklich
> >> eindeutig sind, d.h. in keiner anderen Buchung vorkommen, nach kurzer
> >> Zeit automatisch korrekt zuordnen können.
> > 
> > Schon klar. Aber genau das ist das Problem bei Ein- und Ausgaben - die
> > Konten haben nichts miteinander zu tun und trotzdem schafft der
> > Algorithmus anhand von den Buchungstexten Zuordnungen.
> > 
> >> Einen Punkt möchte ich noch erwähnen, der für das Trainieren des
> >> Algorithmus wirklich wichtig ist. Das Training erfolgt nur mit den
> >> Zuordnungen, die man direkt während des Imports vornimmt. D.h. ein
> >> nachträgliches Umbuchen hat keinen Einfluss mehr auf den Algorithmus.
> >> Man muss direkt beim Importieren alle Zuordnungen korrigieren, die
> >> fehlerhaft sind, bzw. das richtige Konto manuell auswählen, wenn der
> >> Bayes-Algorithmus noch keine automatische Zuordnung gefunden hat.
> > 
> > *Ich* habe diese Art der Konten beim Import garantiert nicht manuell
> > verwechselt.
> > 
> > Grüße,
> > Jörg
> > 
> > 
> > _______________________________________________
> > gnucash-de mailing list
> > gnucash-de at gnucash.org
> > https://lists.gnucash.org/mailman/listinfo/gnucash-de
> 
> _______________________________________________
> gnucash-de mailing list
> gnucash-de at gnucash.org
> https://lists.gnucash.org/mailman/listinfo/gnucash-de


-------------- nächster Teil --------------
Ein Dateianhang mit HTML-Daten wurde abgetrennt...
URL: <http://lists.gnucash.org/pipermail/gnucash-de/attachments/20200512/148fad7f/attachment-0001.html>


Mehr Informationen über die Mailingliste gnucash-de