Der Daten Import / Export Spezialist
Schauen Sie sich auch die verfügbaren Beispiele zum TextFile Adapter an evtl. kann Ihre Frage hiermit schon beantwortet werden: Codepage konvertieren 1 / 2 , Verarbeitung von CSV Kopf- und Fußzeilen , Import und Export von vCard Textdateien

Konvertierung kyrillischer Texte

  • Matthias Rindt
  • Autor
  • Offline
  • Junior Mitglied
  • Junior Mitglied
Mehr
3 Jahre 4 Wochen her #3874 von Matthias Rindt
Konvertierung kyrillischer Texte wurde erstellt von Matthias Rindt
Hallo und ein gesundes Neues Jahr in die Runde!

Wir konvertieren regelmäßig aus einer csv-Datei in ein txt-Datei mit fester Satzlänge Rechnungen um Import in eine Finanzbuchführung.

Nun kommen Buchungstexte und Belegnummer mit kyrillischen Buchstaben vor und diese werden im UTF8 (mit oder ohne BOM) ausgegeben. 

In der Ausgabedatei kommt es nun deswegen zu Spaltenverschiebungen. Diese bringen natürlich das Importprogramm durcheinander bzw. lassen es abstürzen.

Prüft man die Datei vorab z.B. mit den Notepad++ ist diese Spaltenverschiebung zu erkennen wenn man die nicht druckbaren Zeichen anzeigen lässt.

Das Ergebnis sieht z.B. so aus wie in der Datei im Anhang ab Zeile 17.  

Aber auch in den ersten Zeilen kommt es schon zu Verschiebungen. Diese sind aber im Notepad++ gar nicht nachvollziehbar sondern nur im Fehlerprotokoll des Importprogramms durch Auszählen der Spalten ermittelbar.

Was können wir hier noch tun?

Mit IBM855 wird die Ausgabedatei zwar korrekt erstellt. Dann importiert das auf UTF8 eingestellte Importprogramm die kyrillichen Buchstaben aber als Fragezeichen u.ä.

VG und vielen dank, Matthias 


Anhänge:

Bitte Anmelden oder Registrieren um der Konversation beizutreten.

Mehr
3 Jahre 4 Wochen her - 3 Jahre 4 Wochen her #3875 von FlowHeater-Team
FlowHeater-Team antwortete auf Konvertierung kyrillischer Texte
Hallo Herr Rindt,

Wie bzw. von welcher Quelle wurde den die UTF-8 Datei erzeugt? Für mich sieht es so aus als ob hier im TextFile Adapter auf der READ Seite schon falsche Codepage Einstellungen verwendet wurden und dann ziehen sich falsche/fehlerhafte Codepage Umwandlungen auch auf die WRITE Seite durch.

Im Anhang finden Sie eine Definition wo ich Ihre Kyrillische IBM855 Textdatei in UTF-8 konvertiere. Hier stimmt bei mir die UTF-8 Umwandlung, sowie sind keine Spaltenverschiebungen mehr zu erkennen.

Dateianhang:

Dateiname: codepage.zip
Dateigröße:2 KB

gruß
Robert Stark

Wurde Ihre Frage damit beantwortet? Bitte geben Sie ein kurzes Feedback, Sie helfen damit auch anderen die evtl. ein ähnliches Problem haben. Danke.
Anhänge:
Letzte Änderung: 3 Jahre 4 Wochen her von FlowHeater-Team. Begründung: Anhang hinzugefügt

Bitte Anmelden oder Registrieren um der Konversation beizutreten.

  • Matthias Rindt
  • Autor
  • Offline
  • Junior Mitglied
  • Junior Mitglied
Mehr
3 Jahre 4 Wochen her #3876 von Matthias Rindt
Matthias Rindt antwortete auf Konvertierung kyrillischer Texte
Vielen Dank für die schnelle Antwort. Die Quelle ist eine Excel-Datei. Diese habe ich nun als UTF-8 abgespeichert. Die Konvertierung funktioniert und wenn ich mir die Ausgabe anschaue dann sind alle kyrillischen Buchstaben korrekt dargestellt und es sind auch keine Verschiebungen zu erkennen.   

Bitte Anmelden oder Registrieren um der Konversation beizutreten.

Ladezeit der Seite: 0.296 Sekunden

andere Sprachen

en

FlowHeater Home

de en

Impressum/Kontakt

Datenschutz

Copyright © 2009-2023 by FlowHeater GmbH.
Alle Rechte vorbehalten.

Follow us on

twitter  facebook

YouTube

 de en