Jaki jest najlepszy sposób na iterowanie po liniach ciągu Java?

Obecnie używam coś takiego:Jaki jest najlepszy sposób na iterowanie po liniach ciągu Java?

String[]lines = textContent.split(System.getProperty("line.separator")); 
for(String tmpLine : lines){ 
    //do something 
}

nie jestem bardzo zadowolony z tej metody, ponieważ tworzą ciężką tablicę (powiedzmy textContent może zawierać książkę).

Czy istnieje lepsze rozwiązanie do iteracji na liniach String?

Źródło

2012-02-13 alain.janinm

Można użyć:

BufferedReader bufReader = new BufferedReader(new StringReader(textContent));

I użyj metody readLine():

String line=null; 
while((line=bufReader.readLine()) != null) 
{ 

}

Źródło

2012-02-13 11:11:11

Dzięki za odpowiedź. Czy to rozwiązanie zapewnia lepszą wydajność? Zauważyłem, że to rozwiązanie wykorzystuje obiekt ** 3 **. Chcę ograniczyć tworzenie obiektu, aby mieć wystarczającą ilość pamięci, więc 'BufferedReader' i' StringReader' są jaśniejsze niż tablica String? –

Jako javadoc dla stanów BufferedReader, używanie tej klasy jest poprawnym sposobem owijania kosztownych metod odczytu dla ekonomicznych odczytów. Zobacz http://docs.oracle.com/javase/6/docs/api/java/io/BufferedReader.html –

Można użyć String.indexOf() /() String.substring

String separator = System.getProperty("line.separator"); 
int index = textContent.indexOf(separator); 

while (index > 0) 
{ 
    int nextIndex = textContent.indexOf(separator, index + separator.length()); 
    String line = textContent.substring(index + separator.length(), nextIndex); 

    // do something with line. 
}

Źródło

2012-02-13 11:12:17 Brendan

A co z klasą java.util.Scanner?

Podsumowując:

Prosty skaner tekst, który można analizować prymitywnych typów i ciągów za pomocą wyrażeń regularnych.

Skaner dzieli swoje wejście na tokeny za pomocą wzoru separatora, , który domyślnie dopasowuje białe znaki. Wynikowe tokeny mogą następnie zostać przekształcone na wartości różnych typów przy użyciu różnych następnych metod.

i notatki do scenariusza:

Skaner może także używać ograniczników inne niż białe znaki. Ten przykład odczytuje kilka przedmiotów z ciągiem:

 String input = "1 fish 2 fish red fish blue fish"; 
    Scanner s = new Scanner(input).useDelimiter("\\s*fish\\s*"); 
    System.out.println(s.nextInt()); 
    System.out.println(s.nextInt()); 
    System.out.println(s.next()); 
    System.out.println(s.next()); 
    s.close();

Źródło

2012-02-13 11:15:07

stosowanie BufferedReader z StringReader argument. BufferedReader ma metodę readLine(), dzięki czemu możesz czytać linię ciągów po linii.

StringReader reader = new StringReader(myBigTextString); 
    BufferedReader br = new BufferedReader(reader); 
    String line; 
    while((line=br.readLine())!=null) 
    { 
     //do what you want 
    }

Źródło

2012-02-13 11:15:13 shift66

@ alain.janinm, jeśli zachowasz tablicę podzielonych linii, które zajmują dużo pamięci, jak powiedziałeś . W tym przypadku wszystkie wiersze tekstu nie są wczytywane do pamięci. BufferedReader właśnie pamięta ostatni punkt odczytu, a kiedy wywołuje metodę readLine(), po prostu czyta następny wiersz łańcucha (za pomocą StringReadera). Więc w każdej iteracji masz tylko jedną linię tekstu w pamięci (w zmiennej 'line') zamiast wszystkich linii. – shift66

Kombajny java.io.StringReader i java.io.LineNumberReader

Źródło

2012-02-13 11:18:26

Dzięki za odpowiedź. inne proponowane 'BufferedReader'. Jakie są zalety 'java.io.LineNumberReader'? –

Właściwie to po prostu nie zdawałem sobie sprawy, że BufferedReader ma również zaimplementowaną metodę readLine(). –

Dla przyszłych czytelników: LineNumberReader rozszerza BufferedReader, więc LineNumberReader jest zamiennym zamiennikiem BufferedReader z dodatkowym zachowaniem śledzenia numeru linii właśnie przeczytanej linii. Zobacz http://docs.oracle.com/javase/8/docs/api/java/io/LineNumberReader.html. – MonkeyWithDarts

guawy za Splitter działa dobrze. Zwłaszcza jak można usunąć puste wiersze

Splitter splitter = Splitter.on(System.getProperty("line.separator")) 
          .trimResults() 
          .omitEmptyStrings(); 
for (String line : splitter.split(input)){ 
    // do work here 
}

Źródło

2012-02-13 11:31:37

Z kodu źródłowego guavy: '' 'Splitter.on (Pattern.compile (" \ r? \ N ")). Split (wholeFile)' '' –

Dokładniej, jest w Javadoc dla 'Splitter # on': https://google.github.io/guava/releases/snapshot/api/docs/com/google/common/base/Splitter.html#on-java.util.regex.Pattern- – simon04

Aby dodać drogę Java 8 na to pytanie:

Arrays.stream(content.split("\\r?\\n")).forEach(line -> /*do something */)

przekleństwa można również wykorzystać System.lineSeparator() podzielić jeśli masz pewność, że plik jest comming od ta sama platforma, na której działa vm.

Albo jeszcze lepiej wykorzystać API strumień nawet więcej agressiv z filtrem, mapę i zbierać:

String result = Arrays.stream(content.split(System.lineSeparator())) 
        .filter(/* filter for lines you are interested in*/) 
        .map(/*convert string*/) 
        .collect(Collectors.joining(";"));

Źródło

2015-08-15 17:16:22 leo

prawdziwy sposób java8 prawdopodobnie użyłby 'System.lineSeparator()' zamiast właściwości bezpośrednio – xenoterracide

@xenoterracide masz rację! Zmieniono odpowiedź odpowiednio. – leo

Przypadkowo edytowałeś fragment "content" w swoim drugim przykładzie. – Torque

Rzeczywiście można użerać Scanner, aby umożliwić korzystanie z normalną for pętlę:

import java.util.Scanner; 
public class IterateLines { 
    public static void main(String[] args) { 
     Iterable<String> sc =() -> 
      new Scanner("foo bar\nbaz\n").useDelimiter("\n"); 
     for (String line: sc) { 
      System.out.println(line); 
     } 
    } 
}

daje nam:

$ javac IterateLines.java && java IterateLines 
foo bar 
baz

Źródło

2017-02-09 13:12:02

Spowoduje to podział ciągu na spacje i znaki nowej linii, co nie jest tym, czego szuka. – Zulakis

Dzięki @Zulakis - Poprawiłem kod, aby użyć wyraźnego ogranicznika. –

Jaki jest najlepszy sposób na iterowanie po liniach ciągu Java?

Odpowiedz

Powiązane problemy