[gnucash-de] Zurücksetzen des Bayes-Algorithmus

Peter Zimmerer pkzw at web.de
Mi Apr 29 15:47:23 EDT 2020


Hallo Christian,

angeregt durch Deine Nachfrage habe ich mir heute den Import Matcher
nochmal etwas genauer angeschaut. "Gefühlt" hat er sich seit der
Korrektur zum Bug 797587
<https://bugs.gnucash.org/show_bug.cgi?id=797587> bei mir verbessert.

Heute habe ich mir die Import-Zuordnungen aber noch mal etwas genauer
angeschaut und ein paar Unstimmigkeiten gefunden:

Es kommt beim Abruf von Kontoumsätzen vor, dass Umsätze vom vorherigen
Abruf beim nächsten Abruf noch einmal übertragen werden. In der Regel
sind das die Umsätze vom letzten abgerufenen Buchungstag. Diese Umsätze
werden beim zweiten Abruf dann in der Liste der importierten Buchungen
mit "Abgl" markiert und sie laufen noch einmal durch den
Bayes-Algorithmus und erhöhen den Zähler für die
Zuordnungs-Zeichenfolgen (Tokens) der Buchung in Kombination mit dem
vorgeschlagene Zielkonto um 1. Das führt m.E. zu einer ungerechtfertigt
hohen Gewichtung dieser Buchungen.

Ich habe das mit einem Konto ausprobiert, das für heute genau eine
Buchung hat. Zuerst habe ich alle Import-Zuordnungen für dieses Konto im
entsprechenden Editor gelöscht. Dann habe ich ein erstes Mal
Kontoumsätze ab heute abgerufen. Die (eine) Buchung wird mit der Aktion
"Neu" in der Import-Zuordnungen angeboten. Ich habe sie einem Zielkonto
zugeordnet und übernommen. Danach gibt es in den Import-Zuordnungen für
jede Kombination aus "Herkunftskonto-Name", "Zuordnungs-Zeichenfolge"
und "Zugeordneter Kontonamen" einen Eintrag mit dem Zähler 1. Rufe ich
jetzt ein zweites Mal Kontoumsätze ab, wird mir dieselbe Buchung noch
einmal angeboten: diesmal aber mit der vorgeschlagenen Aktion "Abgl".
Lasse ich es bei diesem Vorschlag und übernehme die Zuordnung, so erhöht
sich der Zähler für alle Kombinationen um 1. Nur wenn ich beim zweiten
Mal in den Import-Zuordnungen die Aktion "Abgl" abwähle (damit ist dann
keine Aktion ausgewählt und die Umsatzzeile ist rot eingefärbt), bleibt
der Zähler - wie es sein sollte - auf 1.

Bei der Aktion "Abgl" dürfte meiner Ansicht nach keine Änderung der
Zähler in den Import-Zuordnungen stattfinden. Oder wie siehst Du das?

Anscheinend gibt es auch keine einfache Methode, eine einmal erfolgte
fehlerhafte Zuordnungen noch einmal zu korrigieren, außer der manuellen
(Nach-)Bearbeitung der Import-Zuordnungen. Aber auch da kann man nur
Zeilen löschen und keine Zählerstände korrigieren.

Gruß,
Peter

Am 28.04.20 um 22:28 schrieb Christian Gruber:
> Es ist jetzt schon eine Weile her. Hat jemand eine Rückmeldung für mich,
> ob sich seit der Behebung des Bugs bzgl. der Zuordnung von neu
> importierten Buchungen etwas verändert hat?
> 
> Grüße
> Christian
> 
> Am 05.03.20 um 22:35 schrieb Christian Gruber:
>> Hallo zusammen,
>>
>> meine Änderungen zur Behebung des Bugs 797587
>> <https://bugs.gnucash.org/show_bug.cgi?id=797587> sind am 28.02.20
>> übernommen worden. Falls ihr also eine brandaktuelle GnuCash Version
>> verwendet, könnt ihr mal berichten ob und welche Veränderungen ihr
>> beobachtet. Würde mich interessieren.
>>
>> Grüße,
>> Christian
>>
>>
>> Am 30.01.20 um 20:31 schrieb Christian Gruber:
>>> Hallo Carsten,
>>>
>>> ich habe auch Probleme mit dem Bayes-Algorithmus festgestellt und bin
>>> seit einigen Wochen dabei, diesen zu debuggen.
>>>
>>> Die ersten Fehler habe ich bereits gefunden und gemeldet (siehe Bug
>>> 797587 <https://bugs.gnucash.org/show_bug.cgi?id=797587>). Ich bin
>>> auch schon an einer Lösung dran. Möglicherweise würde das schon
>>> einige Zuordnungsprobleme bei dir lösen.
>>>
>>> Man kann den Algorithmus wieder auf "Null" zurücksetzen, indem man
>>> mit dem Import-Zuordnungen Editor alle Einträge löscht (siehe Antwort
>>> von Hartmut). Allerdings befürchte ich, dass sich die gleichen
>>> Probleme nach kurzer Zeit wieder einstellen werden.
>>>
>>> Gruß Christian
>>>
>>>
>>> Am 27.01.20 um 16:43 schrieb Carsten Paukert:
>>>> Moin zusammen,
>>>>
>>>> ich stelle fest, dass eine ganze Reihe von Buchungen, die ich online
>>>> abrufe, nicht korrekt erkannt und zugeordnet werden. Darunter eine
>>>> ganze Reihe monatlich wiederkehrender Abbuchungen mit, wie ich
>>>> denke, leicht zu identifizierenden Übereinstimmungen.
>>>> Was gibt es für Möglichkeiten, den Algorithmus besser zu trainieren?
>>>> Kann ich ihn irgendwie auf Null setzen und mit dem anlernen von
>>>> vorne beginnen, damit sich von Anfang an keine Fehler einschleichen?
>>>>
>>>> Vielen Dank für Eure Hinweise.
>>>>
>>>> Gruß
>>>>
>>>> Carsten
>>>>
>>>> P.S.: Ich bin  kein Coder. :-/
>>>>
>>>> _______________________________________________
>>>> gnucash-de mailing list
>>>> gnucash-de at gnucash.org
>>>> https://lists.gnucash.org/mailman/listinfo/gnucash-de
> _______________________________________________
> gnucash-de mailing list
> gnucash-de at gnucash.org
> https://lists.gnucash.org/mailman/listinfo/gnucash-de

-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname   : signature.asc
Dateityp    : application/pgp-signature
Dateigröße  : 488 bytes
Beschreibung: OpenPGP digital signature
URL         : <http://lists.gnucash.org/pipermail/gnucash-de/attachments/20200429/a9d482ba/attachment.sig>


Mehr Informationen über die Mailingliste gnucash-de