Antwort
 
Themen-Optionen Thema durchsuchen
Alt 21.01.2007, 03:19 Nach oben    #1
Martin Breuer
 
Benutzerbild von WarrenFaith
 
Registriert seit: 17.08.2005
Ort: Berlin
Beiträge: 1.653
Standard [Notepad++]UTF-8 setzt Zeichen an Dateianfang

Hiho,
ich hab mit Notepad++ Version3.9 ne Datei erstellt, die Zeilenweise durchlesen wird.
In der Datei "regex.pattern" sind folgende Textmuster:
Code:
true "RegEx" "String"
false "Regex" "String"
Nun habe ich mir ne kleine Klasse (in Java) geschrieben, die mir diese Datei zeilenweise ausliest und checkt, ob das Regex auf den String ein true oder false zurückliefert (sprich matcht).
Alles kein Problem, klappt wunderbar bis auf ein Ding:
Er ignoriert die erste Zeile. Ich hab mir also alle eingelesenen Zeilen ausgeben lassen und stelle fest, dass es ein Zeichen in der ersten Zeile geben muss, dass meine Klasse bzw die Überprüfung blockiert. Dieses Zeichen wird mir aber im NP++ nicht angezeigt, allerdings in der Console (allerdings 3 Zeichen die scheinbar die Console wegen des consoleninternen Encodings nicht richtig darstellen kann).
Nun habe ich das Encoding der Datei von UTF-8 auf ANSI geändert und das Zeichen war in der Consolenausgabe verschwunden.

Nun meine Frage:
Ist das erscheinen dieses Zeichens ein reines NP++ "Problem" oder macht jeder Editor ein Encoding-Zeichen vor den Text? Wenn ja, warum ist dann kein Zeichen dabei wenn das Encoding auf ANSI steht?

Hoffe mir kann da mal jemand weiter helfen.
__________________
I did it my way - Senseless-Blog
Weihnachtsgeschenk? Schülern helfen - Bodypainting Kalender für 2009
WarrenFaith ist offline  
Diesen Beitrag zu to del.icio.us hinzufügen!Diesen Beitrag zu Technorati hinzufügen!Diesen Beitrag zu Mister Wong hinzufügen!
Mit Zitat antworten
Alt 21.01.2007, 12:45 Nach oben    #2
Benjamin Steininger
 
Benutzerbild von robo47
 
Registriert seit: 02.06.2005
Ort: weiher im tiefsten Odenwald
Beiträge: 1.208
Standard

Das ist wohl der BOM -> http://en.wikipedia.org/wiki/Byte_Order_Mark
manche Programme machen das, vieleicht findest du mit dem Namen jetzt den passenden Schalter um das auszuschalten ?
robo47 ist offline  
Diesen Beitrag zu to del.icio.us hinzufügen!Diesen Beitrag zu Technorati hinzufügen!Diesen Beitrag zu Mister Wong hinzufügen!
Mit Zitat antworten
Alt 21.01.2007, 18:02 Nach oben    #3
Martin Breuer
 
Benutzerbild von WarrenFaith
 
Registriert seit: 17.08.2005
Ort: Berlin
Beiträge: 1.653
Standard

Ah danke dir!

[Nachtrag]:
Im Encoding gibts dort doch echt ein "UTF-8 without BOM". Da ich aber null schimmer hatte was BOM ist, hab ichs gar nicht erst gesehen
Aber es geht nun auch ohne das Zeichen, danke!
__________________
I did it my way - Senseless-Blog
Weihnachtsgeschenk? Schülern helfen - Bodypainting Kalender für 2009

Geändert von WarrenFaith (23.01.2007 um 09:36 Uhr)
WarrenFaith ist offline  
Diesen Beitrag zu to del.icio.us hinzufügen!Diesen Beitrag zu Technorati hinzufügen!Diesen Beitrag zu Mister Wong hinzufügen!
Mit Zitat antworten
Antwort

Lesezeichen


Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
 
Themen-Optionen Thema durchsuchen
Thema durchsuchen:

Erweiterte Suche

Forumregeln
Es ist dir nicht erlaubt, neue Themen zu verfassen.
Es ist dir nicht erlaubt, auf Beiträge zu antworten.
Es ist dir nicht erlaubt, Anhänge hochzuladen.
Es ist dir nicht erlaubt, deine Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks sind an
PingBacks sind an
RefBacks sind aus


Alle Zeitangaben in WEZ +1. Es ist jetzt 09:06 Uhr.


Powered by vBulletin® Version 3.7.4 (Deutsch)
Copyright ©2000 - 2008, Jelsoft Enterprises Ltd.
Search Engine Optimization by vBSEO 3.2.0

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45