angle-left Back

RE: Qualitätsanalyse (QA)

JH
Jan Horstmann, modified 5 Years ago.

Qualitätsanalyse (QA)

Youngling Posts: 9 Join Date: 2/20/20 Recent Posts
Hier tauschen wir uns über Möglichkeiten der Qualitätsanalyse (QA) mit unterschiedlichen QA-Prozessoren und Methoden aus.
JH
Jan Horstmann, modified 5 Years ago.

RE: Qualitätsanalyse (QA)

Youngling Posts: 9 Join Date: 2/20/20 Recent Posts
https://ocrquality.goobi.io/. Damit läßt sich die Fehlerquote/Erkennungsquote einer OCR messen. Das dort angewandte Verfahren (Bernoulli-Experiment) schlägt auch die DFG in ihren Praxisregeln der Digitalisierung vor.
Heinz Werner Kramski, modified 4 Years ago.

RE: Qualitätsanalyse (QA)

Youngling Posts: 3 Join Date: 5/2/18 Recent Posts
Das DLA hat in Erfassungsprojekten (1,3 Mio Katalogkarten) gute Erfahrungen mit der (vereinfachten) Anwendung des Industriestandards AQL (Acceptable Quality Level, DIN ISO 2859-1, s.a. https://de.wikipedia.org/wiki/Acceptable_Quality_Level) gemacht.

Leider ist frei zugänglich Dokumentation rar; http://www.stahlbauteile.com/aql/aql.html enthält aber die von uns benutzten AQL-Tabellen. Wir haben (ohne große Reflexion) das am häufigsten verwendete Prüfniveau II verwendet.

Der Vorteil von AQL ist, dass die Stichprobengröße nicht linear mit der Größe der Liefermenge steigt, und trotzdem statistisch gesicherte Aussagen über die Qualität gemacht werden können, die von kommerziellen Dienstleistern auch akzeptiert werden.

Beispielsweise prüft man im Prüfniveau II bei einer Liefergröße von 1.000 Einheiten (AQL-Buchstabe J) eine Stichprobe von 80 Einheiten, bei einer Lieferung von 100.000 Einheiten (Buchstabe N) nur 500 Einheiten.

AQL ist m.E. auch für OCR-QS geeignet und würde das Bernoulli-Verfahren ggf. ergänzen bzw. dynamisieren können.

Die OCR-Qualitätsansprüche sollten abgestuft werden:
  • IDs, Datensatznummer o.ä.: extrem hoch
  • Texte, die zu Normdaten werden (Ansetzungsformen von Personen o.ä.) oder Signaturen: sehr hoch
  • Namen, sonstige Entitäten: hoch
  • übriger Text: normal.