[gnucash-de] Bayes Algorithmus: Wichtige Verbesserungsvorschläge

Christian Gruber christian_gruber at gmx.de
So Mai 17 18:21:52 EDT 2020


Hallo Theophilix

Am 15.05.20 um 12:03 schrieb Matthias Gruhn:
>
> Hallo zusammen,
>
> dass der Import-Zuordnungen Editor existiert habe ich erst jetzt
> gesehen! Danke für den Hinweis. Habe nun alle Zuordnungen gelöscht.
>
> Zwei wichtige Verbesserungsvorschläge, die sehr schnell umsetzbar sein
> dürften:
>
> 1. Bitte eine Option für die Mindestlänge der gespeicherten
> Bayes-Begriffe in die Gnucash-Einstellungen rein. Begründung: Wenn
> jedes „+“ oder jeder Schrägstrich aufgenommen wird oder jede kleine
> Zahl, dann sorgt das für Chaos, wenn man die Liste bearbeitet.
> Vielleicht kommt dadurch auch der Algorithmus durcheinander.
>
Ja, diese Überlegung hatte ich anfangs auch. Da man aber normalerweise
wenig bis gar nicht mit dem Import-Zuordnungen Editor arbeiten muss, ist
das auch nicht wirklich schlimm. Ich nehme das mal als Anregung auf und
werde es ggf. an die Entwickler weitergeben.

Ich kann aber zumindest dazu sagen, dass der Bayes-Algorithmus nach
meinen Erkenntnissen durch die vielen kleinen Zeichen weder im negativen
noch im positiven Sinne beeinflusst wird.

> 2. Der Bayes Algorithmus sollte alle Buchungen desjenigen Kontos, in
> das die Buchungen reinsollen, vorher auslesen (falls das nicht schon
> so funktioniert) und diesen Daten höchste Priorität zuteilen.
> Begründung: Die Daten von vergangenen Buchungen im betreffenden Konto
> sind 99% richtig, da bereits überprüft / korrekt zugeordnet.
>
Das ist ebenfalls eine Überlegung, die mich nach wie vor beschäftigt.
Ich halte das ebenfalls für sinnvoll. Wenn etwas dagegen spricht, dann
ist es maximal der Zeitaufwand für das Auslesen aller Buchungen, welcher
dann bei jedem Import anfallen würde. Möglicherweise war das der Grund,
warum sich die Entwickler gegen diese Vorgehensweise entschieden haben.
Ich werde das mal in Erfahrung bringen.
>
> Hierzu eine Überlegung (ignorieren, falls zu banal und schon
> integriert): Statt alle vorhandenen Buchungen auszulesen und in
> Begriffe zu zerlegen (Dauer? Sinn?), könnte der Algorithmus nur einen
> Begriff (Mindestlänge wichtig, s.o. ) der neuen Buchung extrahieren
> und in allen vorhandenen Buchungen danach suchen. Wenn eine passende
> vorhandene Buchung gefunden wird, in der der Begriff vorkommt, soll
> zur Sicherheit ein zweiter Begriff (Mindestlänge wichtig, s.o. ) aus
> der neuen Buchung extrahiert und in der gefundenen Buchung gesucht
> werden. Wenn dieser zweite Begriff in der gefundenen Buchung ebenfalls
> vorliegt soll der Algorithmus das Buchungsziel übernehmen.
> (Verfeinerung des Prinzips dann mit weiteren Begriffen).
>
> Grüße,
>
> Theophilix
>
>
> _______________________________________________
> gnucash-de mailing list
> gnucash-de at gnucash.org
> https://lists.gnucash.org/mailman/listinfo/gnucash-de
-------------- nächster Teil --------------
Ein Dateianhang mit HTML-Daten wurde abgetrennt...
URL: <http://lists.gnucash.org/pipermail/gnucash-de/attachments/20200518/12cb2fbe/attachment.html>


Mehr Informationen über die Mailingliste gnucash-de