[gnucash-de] Zurücksetzen des Bayes-Algorithmus
Jörg Schaible
joerg.schaible at gmx.de
Fr Mai 22 14:22:13 EDT 2020
Hallo Christian,
Am Donnerstag, 14. Mai 2020, 00:28:16 CEST schrieb Christian Gruber:
> Am 12.05.20 um 23:31 schrieb Jörg Schaible:
[snip]
>> Neben den durch Leerzeichen (Zeilenumbruch bei der Übertragung) zerhackten
>> Strings besteht jede Zeile aus einem riesigen Haufen Kutter. Der Bayes
>> Filter muss hier also die Strings "LIDL", "PENNY" und "Deutsche Post"
>> erkennen, um die ersten beiden einem Aufwandskonto "Lebensmittel" zuordnen
>> zu können, bzw. die 3. Buchung zu "Sonstige Ausgaben". Dumm nur, dass man
>> bei LIDL dann manchmal auch was anderes als Lebensmittel kauft. Da würde
>> ich dann gern beim Import bei einem einzelnen Posten manuell zuordnen
>> können, ohne dass der Bayes lernt ganz nach dem Motto "Ignoriere das,
>> diesmal ist es eben anders".
> Schau mal bei dir im Import-Zuordnungen Editor nach (Menü "Werkzeuge"),
Lustig. Nun arbeite ich schon mehr als ein Jahrzehnt mit GnuCash, aber da bin
ich noch nie drüber gestolpert.. :-)
> welchen Konten die Begriffe "LIDL", "PENNY" und "Deutsche Post" zugeordnet
> sind. Gibt es da mehrere Einträge mit verschiedenen Gegenkonten? Sind dort
> Einträge mit "falschen" Gegenkonten dabei? Wenn ja, dann lösche mal diese
> falschen Einträge.
Wie Matthias schon bemerkt hat, gibt es hunderte von seltsamen Regeln hier.
Was mache ich mit Regeln, bei denen steht "Zugeordnetes Konto nicht gefunden"?
Da gibt es ca. 1000 Einträge. Die sind doch eigentlich sinnlos. Auch habe ich
oft mehrere Regeln, bei denen ein einzelnes Zeichen (z.B. '+') auf
verschiedenen Konten verweist. Wenn ich die Bayes-Regeln nach z.B. "LIDL"
filtere, habe ich ca. 20 Treffer, wobei die "richtigen" Regeln auch mit einer
hohen Verwendungszahl aufwarten.
> Wenn danach immer noch mehr als ein Eintrag übrig bleibt, wird es nach
> meiner Beobachtung problematisch. Sobald die Zuordnung nämlich nicht mehr
> eindeutig möglich ist, weil mehr als eine Zuordnung existiert, wird es
> schwierig für den Bayes-Algorithmus. Und zwar funktioniert bei mir der
> Bayes-Algorithmus nur dann korrekt, solange es mindestens einen Begriff gibt,
> den er eindeutig einem Konto zuordnen kann. Das sind in manchen Fällen sogar
> völlig unbedeutende Textschnipsel. Sobald aber kein solcher Begriff mehr
> existiert, gibt der Bayes-Algorithmus keine sinnvollen Ergebnisse mehr aus.
> Dieser Effekt verstärkt sich wahrscheinlich mit der Zeit, je mehr Konten und
> Zuordnungen hinzukommen.
Ich hätte jetzt gedacht, dass Bayes die Regeln der Konten trennt, zumindest
legt das die Darstellung nahe. Auch die Verwendungszahl sollte da irgendwie
ein fließen
> Das dürfte eigentlich nicht sein, denn ein Bayes-Algorithmus ist ein
> statistischer Ansatz und müsste hier wenigstens das Gegenkonto mit den
> häufigsten Zuordnungen höher gewichten als einen "Ausreißer", wo mal eine
> andere Zuordnung erfolgte. Das tut er aber in GnuCash nicht. Ich versuche
> gerade, dem auf den Grund zu gehen.
Und? Hast Du etwas gefunden?
Wo kommen eigentlich die Regeln im Tab "Nicht-Bayesich" her? Da habe ich auch
tausende. Hier scheint es ja sogar unterschiedliche je nach Beschreibung und
Buchungstext zu geben.
Eine Verbesserung wäre nämlich auch, wenn beim Import die Buchungen, die
zwischen Konten getätigt werden, die beide in GnuCash verwaltet werden, immer
eindeutig erkennen und zuordnen würde. Das Gegenkonto steht nämlich
einwandfrei im Buchungstext (nicht in der Beschreibung) drin.
Grüße,
Jörg
Mehr Informationen über die Mailingliste gnucash-de