2015-01-08 15 views
7

For a little fun Chciałem zrobić proste żądanie HTTP w Rust. Rzuciłem to razem i działa świetnie:Co może spowodować, że Rust TcpSocket :: write() zwróci "nieprawidłowe dane wejściowe"?

use std::io::TcpStream; 

fn main() { 
    // This just does a "GET /" to www.stroustrup.com 
    println!("Establishing connection..."); 
    let mut stream = TcpStream::connect("www.stroustrup.com:80").unwrap(); 

    println!("Writing HTTP request..."); 
    // unwrap() the result to make sure it succeeded, at least 
    let _ = stream.write(b"GET/HTTP/1.1\r\n\ 
          Host: www.stroustrup.com\r\n\ 
          Accept: */*\r\n\ 
          Connection: close\r\n\r\n").unwrap(); 

    println!("Reading response..."); 
    let response = stream.read_to_string().unwrap(); 

    println!("Printing response:"); 
    println!("{}", response); 
} 

Odpowiedź brzmi:

Establishing connection... 
Writing HTTP request... 
Reading response... 
Printing response: 
HTTP/1.1 200 OK 
...and the rest of the long HTTP response with all the HTML as I'd expect... 

Jeśli jednak zmienić żądania być /C++.html zamiast /:

use std::io::TcpStream; 

fn main() { 
    // The only change is to "GET /C++.html" instead of "GET /" 
    println!("Establishing connection..."); 
    let mut stream = TcpStream::connect("www.stroustrup.com:80").unwrap(); 

    println!("Writing HTTP request..."); 
    // unwrap() the result to make sure it succeeded, at least 
    let _ = stream.write(b"GET /C++.html HTTP/1.1\r\n\ 
          Host: www.stroustrup.com\r\n\ 
          Accept: */*\r\n\ 
          Connection: close\r\n\r\n").unwrap(); 

    println!("Reading response..."); 
    let response = stream.read_to_string().unwrap(); 

    println!("Printing response:"); 
    println!("{}", response); 
} 

powraca gniazdowe "invalid input":

Establishing connection... 
Writing HTTP request... 
Reading response... 
thread '<main>' panicked at 'called `Result::unwrap()` on an `Err` value: invalid input', /Users/rustbuild/src/rust-buildbot/slave/nightly-dist-rustc-mac/build/src/libcore/result.rs:746 

Dlaczego gniazdo zwraca "invalid input"? Gniazdo TCP nie zna protokołu HTTP (przetestowałem moją prośbę za pomocą telnet i netcat: jest to poprawne), więc nie można narzekać na żądanie/odpowiedź HTTP.

Co znaczy tutaj "invalid input"? Dlaczego to nie działa?

Moja wersja rdza (Jestem na OS X 10.10.1):

$ rustc --version 
rustc 1.0.0-nightly (ea6f65c5f 2015-01-06 19:47:08 +0000) 

Odpowiedz

9

Błąd "invalid input" nie pochodzi z gniazda. Pochodzi z String. Jeśli wywołanie read_to_string() zostanie zmienione na read_to_end(), odpowiedź zakończy się pomyślnie. Najwyraźniej odpowiedź nie jest poprawna w UTF-8.

Więcej wyraźnie, kod:

println!("Reading response..."); 
let response = stream.read_to_end().unwrap(); 

println!("Printing response:"); 
println!("{}", String::from_utf8(response)); 

powraca:

Err(invalid utf-8: invalid byte at index 14787) 

Więc odpowiedź HTTP jest złe. Patrząc na stronie internetowej, to błąd jest tutaj (na znaki są problemem):

Lang.Next'14 Keynote: What � if anything � have we learned from C++? 
1

Znaki obrażając są 0x96 rzeczywiście nieprawidłowy UTF-8. Powinien to być dokument U + 2013 – Dokumentem jest iso-8859-1 lub Windows 1252. Istnieje wiele innych problemów związanych z tym kodem HTML, na przykład nieodwracalny &.

Powiązane problemy