Wygląda na głupi problem, ale nie mogę znaleźć sposobu na filtrowanie pustych wartości z moich wierszy. Jest to wynik, kiedy zrzucić geoinfo obiektu:Filtrowanie pustych wartości za pomocą świni
DUMP geoinfo;
([longitude#70.95853,latitude#30.9773])
([longitude#-9.37944507,latitude#38.91780853])
(null)
(null)
(null)
([longitude#-92.64416,latitude#16.73326])
(null)
(null)
([longitude#-9.15199849,latitude#38.71179122])
([longitude#-9.15210796,latitude#38.71195131])
Oto opis
DESCRIBE geoinfo;
geoinfo: {geoLocation: bytearray}
Co usiłuję zrobić jest filtrowanie wartości null tak:
geoinfo_no_nulls = FILTER geoinfo BY geoLocation is not null;
, ale wynik pozostaje taki sam. nic nie jest filtrowane.
Próbowałem też coś takiego
geoinfo_no_nulls = FILTER geoinfo BY geoLocation != 'null';
i mam błąd
org.apache.pig.backend.executionengine.ExecException: ERROR 1071: Cannot convert a map to a String
Co robię źle?
szczegóły, działa na Ubuntu, Hadoop-1.0.3 ze świni 0.9.3
świnia -version Apache Pig wersji 0.9.3-SNAPSHOT (rexported) skompilowany 24 października 2012, 19:04:03
wersjajava "1.6.0_24" OpenJDK Runtime Environment (IcedTea6 1.11.4) (6b24-1.11.4-1ubuntu0.12.04.1) OpenJDK 64-bitowy serwer VM (build 20.0-B12, tryb mieszany)
Proszę wysłać kompletny skrypt. –