[gnucash-de] Zurücksetzen des Bayes-Algorithmus

Jörg Schaible joerg.schaible at gmx.de
Fr Mai 22 14:22:13 EDT 2020


Hallo Christian,

Am Donnerstag, 14. Mai 2020, 00:28:16 CEST schrieb Christian Gruber:


> Am 12.05.20 um 23:31 schrieb Jörg      Schaible:

[snip]
      
>> Neben den durch Leerzeichen (Zeilenumbruch bei der Übertragung) zerhackten 
>> Strings besteht jede Zeile aus einem riesigen Haufen Kutter. Der Bayes
>> Filter muss hier also die Strings "LIDL", "PENNY" und "Deutsche Post"
>> erkennen, um die ersten beiden einem Aufwandskonto "Lebensmittel" zuordnen
>> zu können, bzw. die 3. Buchung zu "Sonstige Ausgaben". Dumm nur, dass man
>> bei LIDL dann manchmal auch was anderes als Lebensmittel kauft. Da würde
>> ich dann gern beim Import bei einem einzelnen Posten manuell zuordnen
>> können, ohne dass der Bayes lernt ganz nach dem Motto "Ignoriere das,
>> diesmal ist es eben anders".        

> Schau mal bei dir im Import-Zuordnungen Editor nach (Menü "Werkzeuge"),

Lustig. Nun arbeite ich schon mehr als ein Jahrzehnt mit GnuCash, aber da bin 
ich noch nie drüber gestolpert.. :-)

> welchen Konten die Begriffe "LIDL", "PENNY" und "Deutsche Post" zugeordnet
> sind. Gibt es da mehrere Einträge mit verschiedenen Gegenkonten? Sind dort
> Einträge mit "falschen" Gegenkonten dabei? Wenn ja, dann lösche mal diese
> falschen Einträge.    

Wie Matthias schon bemerkt hat, gibt es hunderte von seltsamen Regeln hier. 
Was mache ich mit Regeln, bei denen steht "Zugeordnetes Konto nicht gefunden"? 
Da gibt es ca. 1000 Einträge. Die sind doch eigentlich sinnlos. Auch habe ich 
oft mehrere Regeln, bei denen ein einzelnes Zeichen (z.B. '+') auf 
verschiedenen Konten verweist. Wenn ich die Bayes-Regeln nach z.B. "LIDL" 
filtere, habe ich ca. 20 Treffer, wobei die "richtigen" Regeln auch mit einer 
hohen Verwendungszahl aufwarten.

> Wenn danach immer noch mehr als ein Eintrag übrig bleibt, wird es nach
> meiner Beobachtung problematisch. Sobald die Zuordnung nämlich nicht mehr
> eindeutig möglich ist, weil mehr als eine Zuordnung existiert, wird es
> schwierig für den Bayes-Algorithmus. Und zwar funktioniert bei mir der
> Bayes-Algorithmus nur dann korrekt, solange es mindestens einen Begriff gibt,
> den er eindeutig einem Konto zuordnen kann. Das sind in manchen Fällen sogar
> völlig unbedeutende Textschnipsel. Sobald aber kein solcher Begriff mehr
> existiert, gibt der Bayes-Algorithmus keine sinnvollen Ergebnisse mehr aus.
> Dieser Effekt verstärkt sich wahrscheinlich mit der Zeit, je mehr Konten und
> Zuordnungen hinzukommen.    

Ich hätte jetzt gedacht, dass Bayes die Regeln der Konten trennt, zumindest 
legt das die Darstellung nahe. Auch die Verwendungszahl sollte da irgendwie 
ein fließen

> Das dürfte eigentlich nicht sein, denn ein Bayes-Algorithmus ist ein
> statistischer Ansatz und müsste hier wenigstens das Gegenkonto mit den
> häufigsten Zuordnungen höher gewichten als einen "Ausreißer", wo mal eine
> andere Zuordnung erfolgte. Das tut er aber in GnuCash nicht. Ich versuche
> gerade, dem auf den Grund zu gehen.    

Und? Hast Du etwas gefunden?

Wo kommen eigentlich die Regeln im Tab "Nicht-Bayesich" her? Da habe ich auch 
tausende. Hier scheint es ja sogar unterschiedliche je nach Beschreibung und 
Buchungstext zu geben.

Eine Verbesserung wäre nämlich auch, wenn beim Import die Buchungen, die 
zwischen Konten getätigt werden, die beide in GnuCash verwaltet werden, immer 
eindeutig erkennen und zuordnen würde. Das Gegenkonto steht nämlich 
einwandfrei im Buchungstext (nicht in der Beschreibung) drin.
      
Grüße,      
Jörg      




Mehr Informationen über die Mailingliste gnucash-de