Impressum · Kontakt · Hilfe
Besucher online · Mitglieder



Portal > Foren > PHP > PHP-Programmierung > charset und file_get_contents()
Antwort
 
Themen-Optionen
Alt 17.01.2007, 20:58   Nach oben    #1
Jann Hendrik
Projektleiter
 
Benutzerbild von Jann Hendrik
 
Registriert seit: 02.12.2004
Ort: Wildeshausen
Beiträge: 2.233
Standard charset und file_get_contents()

Hi!

Ich nutze file_get_contents um den Inhalt einer anderen Seite auszulesen (ja, ist legal, daher hierzu bitte keine Diskussion).

Wenn ich die Seite im Browser aufrufe, dann habe ich auch keine Problem mit äöüß, aber ich nutze nun die genannte Funktion, dabei kommt an den entsprechenden Stellen nur Müll raus.

Die Seite hat folgende Zeile im Quellcode:
Code:
<META HTTP-EQUIV="Content-Type" CONTENT="text/html;charset=utf-8">
Daher gehe ich davon aus, dass es sich um utf-8 handelt.
Kann ich das irgendwie konvertieren, oder ... sonstwas machen, damit ich wieder richtige Buchstaben bei mir sehe?
__________________

Umfragen:
bitte beachten: Vorschläge für künftige Umfragen
Woher weißt du vom developers-guide?

Wenn du dich in ein interessantes Thema eingearbeitet hast, dann lass andere daran teilhaben! Schreibe ein Tutorial und beschreibe, wie es geht, was nicht klappt, wo man aufpassen muss usw.
Danke!
Jann Hendrik ist offline  
Add Post to del.icio.usBookmark Post in TechnoratiDiesen Beitrag zu Mister Wong hinzufügen!
Mit Zitat antworten
Alt 17.01.2007, 21:15   Nach oben    #2
Bleistift
Erfahrener Benutzer
 
Benutzerbild von Bleistift
 
Registriert seit: 31.12.2006
Ort: Zürich
Beiträge: 287
Standard

utf8-decode() und dann noch evt. htmlentities()
__________________
. <-- This is Punkt. Copy Punkt into your signature to help him on his way to world domination.
Bleistift ist gerade online  
Add Post to del.icio.usBookmark Post in TechnoratiDiesen Beitrag zu Mister Wong hinzufügen!
Mit Zitat antworten
Alt 17.01.2007, 21:17   Nach oben    #3
Jann Hendrik
Projektleiter
 
Benutzerbild von Jann Hendrik
 
Registriert seit: 02.12.2004
Ort: Wildeshausen
Beiträge: 2.233
Standard

ok, danke dir - werde ich mal morgen mit rumprobieren!


das htmlentities werde ich wohl nicht nutzen, weil ich mir nur den relevanten Inhalt aus dem body-Bereich rausschneide...
__________________

Umfragen:
bitte beachten: Vorschläge für künftige Umfragen
Woher weißt du vom developers-guide?

Wenn du dich in ein interessantes Thema eingearbeitet hast, dann lass andere daran teilhaben! Schreibe ein Tutorial und beschreibe, wie es geht, was nicht klappt, wo man aufpassen muss usw.
Danke!
Jann Hendrik ist offline  
Add Post to del.icio.usBookmark Post in TechnoratiDiesen Beitrag zu Mister Wong hinzufügen!
Mit Zitat antworten
Alt 17.01.2007, 22:34   Nach oben    #4
CIX88
Erfahrener Benutzer
 
Registriert seit: 18.03.2005
Beiträge: 576
Standard

Oder gibt es Konflikte mit der Datei, wo der Inhalt mit file_get_contents reingeholt wird ?
CIX88 ist offline  
Add Post to del.icio.usBookmark Post in TechnoratiDiesen Beitrag zu Mister Wong hinzufügen!
Mit Zitat antworten
Alt 18.01.2007, 00:07   Nach oben    #5
Basti
Erfahrener Benutzer
 
Registriert seit: 04.01.2006
Ort: Kassel
Beiträge: 750
Standard

Mit utf8_decode() kannst du nur Zeichen umwandeln, die in Latin 1 auch vorhanden sind. Wenn du den Inhalt nur durchschleifen willst, dann gib einfach auch den entsprechenden Header aus:

header('Content-Type: text/html; charset=UTF-8');

Meta-Tag alleine reicht nicht aus, wenn dein Server eine andere Kodierung ausspuckt und du die nicht "überschreibst".

Basti
Basti ist offline  
Add Post to del.icio.usBookmark Post in TechnoratiDiesen Beitrag zu Mister Wong hinzufügen!
Mit Zitat antworten
Alt 18.01.2007, 01:59   Nach oben    #6
dejan_spasic
Erfahrener Benutzer
 
Benutzerbild von dejan_spasic
 
Registriert seit: 05.01.2006
Ort: Düsseldorf
Beiträge: 168
Standard

Diese Informationen könnten auch nützlich sein:
__________________
Da wir alle in einem Boot sitzen, ist es gut, dass wir nicht alle auf einer Seite stehen... (mir unbekannt)
dejan_spasic ist offline  
Add Post to del.icio.usBookmark Post in TechnoratiDiesen Beitrag zu Mister Wong hinzufügen!
Mit Zitat antworten
Alt 18.01.2007, 07:11   Nach oben    #7
Jann Hendrik
Projektleiter
 
Benutzerbild von Jann Hendrik
 
Registriert seit: 02.12.2004
Ort: Wildeshausen
Beiträge: 2.233
Standard

also - ich hole mir den Inhalt mit file_get_contents und mit die Um-Kodierung mit utf8_decode funktioniert, weil es nur Zeichgen betrifft, die dann auch dargestellt werden können.

Somit hat sich das Problem meinerseits gelöst.

Den header wollte ich meinerseits nicht ändern, weil ich nur einen Teil der ausgelesenen Seite auslesen wollte - und das in der neuen Seite auch nur einen kleinen Teil darstellt.
__________________

Umfragen:
bitte beachten: Vorschläge für künftige Umfragen
Woher weißt du vom developers-guide?

Wenn du dich in ein interessantes Thema eingearbeitet hast, dann lass andere daran teilhaben! Schreibe ein Tutorial und beschreibe, wie es geht, was nicht klappt, wo man aufpassen muss usw.
Danke!
Jann Hendrik ist offline  
Add Post to del.icio.usBookmark Post in TechnoratiDiesen Beitrag zu Mister Wong hinzufügen!
Mit Zitat antworten
Antwort

Lesezeichen


Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
 
Themen-Optionen

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist An.
Smileys sind An.
[IMG] Code ist An.
HTML-Code ist Aus.
Trackbacks are An
Pingbacks are An
Refbacks are Aus

Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
Charset und locales WarrenFaith PHP-Programmierung 9 23.09.2005 09:48


Alle Zeitangaben in WEZ +2. Es ist jetzt 23:58 Uhr.

Nach oben
Wir nutzen das Zend Framework, vBulletin (vBulletin v3.7.2, Copyright ©2000-2008, Jelsoft Enterprises Ltd.
SEO by vBSEO 3.0.0) und vBSEO.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44