Pytanie:
Czy dane historyczne z próby losowej nie są reprezentatywne?
user967
2017-02-12 23:39:10 UTC
view on stackexchange narkive permalink

Jestem sceptykiem globalnego ocieplenia i jednym z moich zmartwień jest dokładność historycznych globalnych temperatur. Skoro te temperatury nie były pobierane w przypadkowych miejscach lub punktach siatki, czy można je uznać za dokładne odwzorowanie „temperatury globalnej”?

Myśli / itp .:

  • https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3982162/ mówi o tym w sensie czasowym, ponieważ wykorzystując średnią z minimalnych i maksymalnych dziennych temperatur przy danej lokalizacja nie jest najlepszym sposobem na określenie średniej temperatury. Nie omawia jednak losowego próbkowania / siatki geograficznej.

  • http://onlinelibrary.wiley.com/doi/10.1002/joc.4580/full zauważa, że ​​ten problem istnieje i wykonuje pomiary z równomierną siatką, ale jest on ograniczony do określonego regionu i okresu (1979-2012).

  • Wiem, że klimatolodzy wycinają Uziemić w siatkę, aby uniknąć błędu grupowania, ale to nie to samo i nie jest przydatne, jeśli oryginalne odczyty nie odzwierciedlają dokładnie wycinka / regionu.

  • I zdajemy sobie również sprawę z tego, że klimatolodzy mają inne miary globalnego ocieplenia, ale liniowa regresja rzeczywistych pomiarów temperatury wydaje się być najczęściej stosowana do przekonania opinii publicznej, więc ich dokładność wydaje się ważna.

  • Jako sceptyk chciałbym również wiedzieć, czy generalnie większość argumentów za globalnym ociepleniem ma charakter statystyczny (tj. Regresja liniowa mierzonych zmiennych), czy też te statystyczne są najbardziej „fotogeniczne” dla opinii publicznej konsumpcja? Innymi słowy, czy cały argument dotyczący temperatury pobranej losowo / z siatką jest czerwonym śledziem?

EDYTUJ (aby wyjaśnić pytanie):

Aby określić średnią temperaturę powierzchni Ziemi, możemy zastosować jedną z następujących metod:

  • Zmierz temperaturę Ziemi w każdym punkcie i średnią. Oczywiście jest to fizycznie niemożliwe, ponieważ punkt jest 0-wymiarową matematyczną abstrakcją, ale możemy zrobić coś bliskiego z satelitami.

  • Wybierz dużą liczbę losowych punktów na powierzchni Ziemi (ten losowy rozkład jest jednolity pod względem długości, ale nie szerokości geograficznej - na szerokości geograficznej wyglądałby jak krzywa cosinus), zmierz temperaturę i uśrednij . Oprócz podania średniej, dałoby nam to odchylenie standardowe, więc możemy powiedzieć „jesteśmy w 95% pewni, że prawdziwa średnia temperatura Ziemi to X plus minus Y”.

  • Weź równomiernie rozmieszczoną siatkę (nietrywialną, ponieważ odległość między długościami zależy od szerokości geograficznej), zmierz temperaturę w tych punktach i średnią. Jest to podobne do pierwszego podejścia, ale z mniejszą liczbą punktów. O ile nie uważamy, że nasze punkty siatki wprowadzają odchylenie, powinno to być tak dokładne, jak próbkowanie losowe.

Mój problem: pomiary temperatury w przeszłości nie były wykonywane ŻADNĄ z tych metod. Punkty, w których mierzono temperaturę, nie były wybierane losowo ani w sposób siatkowy. Jak więc mogą one być dokładnym pomiarem temperatury historycznej, nawet jeśli uwzględniamy tylko zmiany temperatury?

UWAGA: Zdaję sobie sprawę, że temperatura powierzchni nie jest najlepszą miarą globalnego ocieplenia, ponieważ woda ma znacznie wyższy ciepło właściwe niż ziemia (między innymi), ale na tym skupiam się w tym pytaniu.

LOL! :) Nie, mam na myśli „globalne ocieplenie” bez względu na przyczynę, od 1900 roku lub innych ram czasowych, których zwykle używają zwolennicy globalnego ocieplenia. Myślałem, że Ziemia zaczęła się gorąco? A może masz na myśli globalne ocieplenie, takie jak promieniowanie słoneczne?
Jeśli wątpisz, że Ziemia ociepliła się w ciągu ostatnich ponad 100 lat, po prostu spójrz na zdjęcia zasięgu lodowców i lodu morskiego w czasie. Nikt inny nie wątpi, że temperatura się ociepla, nawet republikanie. Po prostu mówią, że nie jest to spowodowane działalnością człowieka.
Nie sądzę, żeby to było dokładne przedstawienie ich (lub mojej) pozycji. Mówię, że nie wierzę, że istnieją wystarczające dowody na to, że Ziemia w ogóle się rozgrzała **. Wskaż mi te zdjęcia (i / lub inne dowody nieoparte na temperaturze)?
Więc wzrost poziomu morza, utrata lodowca i zapisy temperatury są błędne? I tak, to dokładna reprezentacja ich pozycji. Wypróbuj te: https://www.nps.gov/olym/learn/nature/glaciers.htm http://video.nationalgeographic.com/video/news/151021-glacier-national-park-melting-vin http: / /www.climatehotmap.org/global-warming-locations/glacier-national-park-mt-usa.html http://time.com/4447252/greenland-ice-climate-change/ https: //www.e- education.psu.edu/earth103/node/767 http://nsidc.org/arcticseaicenews/ http://climate.jpl.nasa.gov/vital-signs/arctic-sea-ice/
Właśnie tego szukałem: innych powodów, by wierzyć w globalne ocieplenie. Sprawdzę linki, ale tak naprawdę to prawdopodobnie nie ma znaczenia: ** moje ** stanowisko jest takie, że nie ma dobrych dowodów na globalne ocieplenie i właśnie to próbuję zbadać.
Pomiary można interpolować do regularnych siatek przy użyciu metod interpolacji geostatystycznej. Metody te były wielokrotnie testowane, np. przy użyciu weryfikacji krzyżowej. Brak regularnych pomiarów siatkowych nie oznacza, że ​​wyniki oparte na istniejących pomiarach są fałszywe / błędne / bezużyteczne. Naukowcy są świadomi, jakie mają dane i jak sprawdzać ich jakość i wiarygodność.
@FuzzyLeapfrog Interpolacja nie jest problemem, ponieważ interpolacja złych danych daje po prostu więcej złych danych. Czy chcesz powiedzieć, że użycie określonych punktów do określenia interpolacji jest równoważne z interpolacją temperatury satelity? Czy możesz to zdobyć? Tego rodzaju badań szukam.
Z tym argumentem Twoje początkowe pytanie wydaje się być przestarzałe, tj .: Jeśli masz złe pomiary, zwiększenie punktów pomiarowych da po prostu więcej złych danych. Jeśli szukasz metod interpolacji danych stacji, zobacz np. optymalna interpolacja lub kriging.
@FuzzyLeapfrog Nie. Mówię: jeśli masz 2 dobre (ale nie losowo wybrane) pomiary w regionie i uśredniasz je (metoda A), a następnie uśredniasz miliony punktów w tym samym regionie (np. Przez satelitę, nazwij to metoda B), otrzymane wyniki będą inne. W przypadku zapisów historycznych dostępna była tylko metoda A. Skąd wiemy, że to to samo, co metoda B? Innymi słowy, skąd wiemy, że średnie próbki punktowe faktycznie reprezentują temperaturę regionu?
Widzę. Powinieneś przepisać swoje początkowe pytanie, aby określić, co masz na myśli.
Przyczyna globalnego ocieplenia to temat, który może być przedmiotem dyskusji między rozsądnymi ludźmi. Niestety, niewiele lub rozsądnych na ten temat. Fakt, że globalne ocieplenie istnieje bez względu na przyczynę, jest przedmiotem całkowicie jednostronnych dowodów i nie ma realnego miejsca na interpretację. Jeśli ten dowód, który jest szeroko rozpowszechniony i spójny, jest nie do przyjęcia, to żaden dowód nie będzie.
@dlb Cóż, właśnie takich dowodów szukam: powszechnych, spójnych i statystycznie ważnych. Wkrótce przejdę i edytuję moje pytanie.
`` Sprawdzę linki, ale tak naprawdę to chyba nie ma znaczenia '' - to mówi wszystko. Jeśli nie jesteś zainteresowany oglądaniem dowodów, dlaczego zadajesz to pytanie?
@bon Moje pytanie dotyczy przede wszystkim danych dotyczących temperatury powierzchni oraz innych dowodów na globalne ocieplenie. Przydatne, ale nie odpowiadam na moje podstawowe pytanie dotyczące temperatur powierzchni.
@BarryCarter Biorąc pod uwagę inne dowody, przesłanka twojego pytania (że globalne ocieplenie nie ma miejsca) jest błędna, więc jest bardzo istotna. Co masz na myśli, mówiąc, że próbka odczytów nie jest przypadkowa? Jak myślisz, jaki rodzaj uprzedzeń został wprowadzony?
W jakim sensie historyczne zapisy temperatury nie są pobierane z przypadkowych miejsc? Losowe jest to, że lokalizacje były zdeterminowane kaprysami ludzkiego osadnictwa i chęcią prowadzenia rejestrów temperatury, a nie selekcją a priori, aby uzyskać pożądany rezultat. (Zauważ też, że naprawdę musisz zacząć od drugiego końca: fizyka mówi, że dodanie X ilości CO2 do atmosfery powinno wytworzyć ocieplenie Y. Więc kiedy pomiary, jakkolwiek niedoskonałe, pokaż, że nastąpiło ocieplenie, co to jest? logiczny wniosek?)
@jamesqf „Random” ma specyficzne znaczenie w statystykach, a „kaprysy osadnictwa ludzkiego” nie kwalifikują się. Postaram się zaktualizować moje pytanie, aby było bardziej bezpośrednie.
@BarryCarter Jaki rodzaj błędu, twoim zdaniem, jest wprowadzony przez historyczny zapis temperatury? Próba losowa to taka, która jest wolna od systematycznych błędów, więc jeśli nie ma błędu, to jest ona zasadniczo losowa.
@bon Statystycznie próba losowa to taka, w której każdy punkt ma równe szanse na wybranie. Oczywiście w miastach i na lotniskach z biegiem lat rośnie populacja / wykorzystanie, ale to nie ma znaczenia. Nie możesz ubiegać się o wybór losowy po fakcie, jeśli nie został wybrany losowo na początku.
@BarryCarter Jaki rodzaj błędu, twoim zdaniem, został wprowadzony do historycznego zapisu temperatury?
Jeśli chodzi o „… większość argumentów za globalnym ociepleniem ma charakter statystyczny…”, masz rzeczy wstecz. Argument za GW jest fizyczny. Wiemy, że CO2 blokuje IR i możemy obliczyć (po prostu: Arrhenius wykonał przyzwoite przybliżenie ołówkiem i papierem), że dodanie X ilości CO2 do atmosfery powinno spowodować ocieplenie Y. Pomiary temperatury, topniejące lodowce i tak dalej są po prostu POTWIERDZENIEM, że to, czego oczekujemy od fizyki, rzeczywiście się wydarza.
@jamesqf Właściwie nigdy nie udało mi się znaleźć eksperymentów pokazujących wzrost CO2 w wyniku ocieplenia - sprawdzę Arrheniusa.
@Barry Carter: Dobrym miejscem do rozpoczęcia może być http://history.aip.org/climate/index.htm Więcej, niż większość ludzi chciałaby wiedzieć. A eksperymenty (przeprowadzone w laboratorium) pokazują, że CO2 blokuje podczerwień: ocieplenie jest logicznym wnioskiem.
@jamesqf Sprawdzę to, ale jeśli CO2 blokuje promienie podczerwone przed dotarciem do powierzchni Ziemi, czy nie oznacza to mniej ciepła? A może częstotliwość światła zmienia się po odbiciu się od Ziemi (prawdopodobnie prawda, ponieważ Ziemia ma kolor) i blokuje wychodzenie podczerwieni?
@Barry Carter: Krótkie (i prawdopodobnie zbyt uproszczone) wyjaśnienie jest takie, że energia słoneczna występuje głównie w widmie widzialnym. Kiedy uderza w ziemię, ogrzewa ją. Ciepła ziemia emituje długie fale podczerwone, a CO2 blokuje jej ponowne wydostanie się. Dlatego nazywa się to efektem cieplarnianym.
Dwa odpowiedzi:
John
2017-02-15 21:20:28 UTC
view on stackexchange narkive permalink

Próbki nie muszą być losowe, aby były prawidłowe, pomaga, ale nie jest niezbędne, zwłaszcza jeśli są wyczerpujące, spójne i mają dużą wielkość próby, zwłaszcza w przypadku badań obserwacyjnych. Próba reprezentatywna różni się od próby losowej. Pamiętaj, że nie próbujemy osiągnąć globalnej temperatury z najwyższym stopniem dokładności w jednej chwili, staramy się zmierzyć zmianę temperatury w długim okresie czasu. Dlatego spójność lokalizacji jest ważniejsza niż losowanie lokalizacji.

Fakt, że punkty próbkowania nie poruszają się, jest istotny, wiemy, że na temperaturę mają wpływ warunki regionalne, jeśli próbki były ponownie randomizowane (przenoszone) co pomiar sprawiłby, że byłby mniej dokładny, a nie bardziej. Pamiętaj, co jest mierzone, zmiana , ponieważ punkty próbkowania nie są przenoszone, zmiana będzie dokładna, ponieważ zasadniczo staje się próbką warstwową. Jeśli na przykład mierzę zmiany temperatury silnika, nie chcę za każdym razem mierzyć w innym punkcie, o ile punkty (lokalizacje) są spójne, próbka zachowa wysoką dokładność. Próbkowanie losowe byłoby MNIEJ dokładne, ponieważ mogłoby wywołać zamieszanie, ponieważ wiemy, że rozkład temperatury w silniku (lub kuli ziemskiej) nie jest przypadkowy. Każda zmiana lokalizacji pomiędzy pomiarami spowodowałaby mylące dane. Prawie żadna nauka nie używa prawdziwie losowych próbek, po prostu nie jest to możliwe. Rozważ takie rzeczy, jak próbkowanie wyczerpujące, próbkowanie klastrów, próbkowanie warstwowe i próbkowanie systematyczne, wszystkie są używane częściej niż próbkowanie losowe, a każda z nich jest dokładniejsza niż losowa w odpowiednich okolicznościach.

Rozważmy przykład, powiedzmy, że próbujesz zmierzyć zmianę temperatury w silniku w czasie. Gdzie na silniku podłączę moje czujniki nie ma znaczenia, o ile ich nie ruszam, zwłaszcza jeśli założę na to wiele czujników. Mógłbym umieścić trzydzieści czujników na silniku po lewej stronie i mierzyłby zmianę temperatury bardzo dokładnie, w porównaniu do przesuwania czujników między każdym pomiarem. Nie daj się nabrać na błąd idealnego rozwiązania. Należy również pamiętać, że jest to badanie obserwacyjne / opisowe z samej swej natury.

Każdy punkt na mapie bardziej przypomina powtórzenie. Rzeczywisty niezależny to czas, w którym są one próbkowane, który jest podzielony na warstwy lub zgrupowany w zależności od tego, do którego badania się odnosisz. Zwróć uwagę, że wiele zestawów punktów danych jest również porównywanych. NOAA, BEST itp. To niezależne zestawy danych, które można porównać i które pokazują ten sam wzór.

Wysokie i niskie są używane do pomiarów, ponieważ to wszystko, co zostało zarejestrowane w najstarszych pomiarach, więc zmiana formatu wymagałaby wyrzucenia wszystkich tych danych, drastycznie skracając liczebność próby (tracąc ponad połowę czasu). W tym przypadku dokładność uzyskana przez znacznie większą liczbę próbek jest większa niż w przypadku lokalizacji losowej lub siatkowej. Losowość rzadko jest możliwa w przypadku danych historycznych, dlatego tak ważna jest wielkość i spójność zbioru danych. Fajne jest to, że są one również porównywane z innymi metodami próbkowania w innych skalach czasowych, aby sprawdzić, czy pokazują ten sam wzorzec. Historycy zdają sobie sprawę z ograniczeń swoich danych, dlatego tak ważna jest niezależna weryfikacja.

Rozważmy teraz dane rdzenia lodowego. Byłem zaskoczony, kiedy powiedziałeś, że najczęściej używano temperatury powierzchni. Widzę dane z rdzeni lodowych znacznie częściej, ponieważ rejestrują one znacznie dłuższy okres i rejestruje inne rzeczy (np. zawartość $ CO_ {2} $). Ponownie, każdy rdzeń jest powtórzeniem, a rdzeń może być próbkowany w sposób losowy lub warstwowy, rozwarstwienie jest najczęstsze, ponieważ jest bardziej wyczerpujące w próbce rdzeniowej. Rdzenie lodowe są również porównywane z rdzeniami lodowymi w wielu innych lokalizacjach.

Kolejną kwestią jest porównanie krzyżowe, czyli użycie wielu niezależnych form pomiaru, rdzenia lodowego w porównaniu z satelitą, w porównaniu z powierzchnią itp. Porównuje się dziesiątki różnych form pomiarów / eksperymentów i pokazuje ten sam wzór.

To prawdopodobnie jeden z najlepszych przeglądów nauki, jakie widziałem. Jest trochę stary (2013), więc jeśli ktoś widział nowszą wersję, chciałbym go zamiast tego użyć.

„Próbki nie muszą być losowe, aby były ważne”. Nie zgadzam się. Czy możesz pokazać, dlaczego jest to uzasadnione statystycznie? Zgadzam się, że punkty nie powinny się zmieniać: wybierasz je raz (losowo) i obserwujesz zmianę. Twierdzę, że nawet zmiana temperatury lub skrajnych temperatur dla nieprzypadkowo wybranych lokalizacji nie jest reprezentatywna dla zmiany średniej temperatury Ziemi. "Fajne jest to, że są one również porównywane z innymi metodami próbkowania w innych skalach czasowych". Byłoby to naprawdę przydatne w walidacji starych danych. Czy jest źródło? Przyjrzę się danym z rdzeni lodowych.
Pomierzyłem w silniku na moim przykładzie, lokalizacja czujnika nie jest przypadkowa, tak naprawdę przy pojedynczym czujniku nie byłoby to przypadkowe. Nie oznacza to, że nie może dać dokładnego pomiaru zmiany temperatury silnika, a sama temperatura jest średnią.
Dałem jeden, ale oto kolejny dodam jeszcze kilka, https://climatedataguide.ucar.edu/climate-data/global-temperature-data-sets-overview-comparison-table
Jeśli szukasz podziału matematycznego, możesz wypróbować funkcję wymiany stosów statystyk. http://stats.stackexchange.com/questions/31488/identifying-the-population-and-samples-in-a-study#32149
** „Należy próbować wyciągać wnioski tylko z populacji, z której została wylosowana próba i tylko wtedy, gdy próba jest losowana”. ** jest akceptowaną odpowiedzią (choć nie tą, na którą wskazałeś). Silnik to zła analogia. Mówię, że zmiany temperatury w nieprzypadkowo wybranych punktach różnią się istotnie od zmian temperatury średniej temperatury Ziemi jako całości i nie ma sposobu, aby uzyskać tę drugą (której naprawdę chcemy) od pierwszej (co mamy).
czym się różni, oba są oszacowaniami średniej zmiany temperatury całości obliczonej na podstawie pomiarów temperatury z nielosowo wybranych punktów całości. Każda miara temperatury jest średnią. I pamiętaj, że nie próbujemy uzyskać dokładnej, absolutnej miary temperatury, którą próbujemy uzyskać w czasie. Hipotetycznie można to zrobić z jednego czujnika, ale więcej czujników zapewnia większą dokładność. Czy jest to absolutnie najlepszy scenariusz, idealny sposób na zrobienie tego, nie, czy jest to oczywiście statystycznie ważne i użyteczne.
Twój własny przykład kratkowania pomaga udowodnić mój punkt widzenia, jest z definicji przeciwieństwem losowości, jest jednak wystarczająco reprezentatywny do użycia. Podobnie duże, częściowo losowe rozproszenie czujników, które obejmuje całą kulę ziemską, jest wystarczająco reprezentatywne do użycia, zwłaszcza przy niezależnej weryfikacji i spójnym pobieraniu próbek. Twoja próbka musi być reprezentatywna. Losowanie to najlepszy sposób na osiągnięcie tego, ale nie jedyny.
Ponieważ wydaje się, że masz problem ze sposobem, w jaki nauka wykorzystuje statystyki jako całość. Proponuję zapytać, jak nielosowe próbkowanie może być ważne w wymianie stosów statycznych. AKA Cross Validated
OK, ale jestem prawie pewien, że bez dodatkowego uzasadnienia próbkowanie nielosowe nigdy nie jest poprawne.
@BarryCarter Zdecydowana większość eksperymentów naukowych wykorzystuje próbkowanie nielosowe. Nie umieszczasz swojego urządzenia pomiarowego w dowolnym miejscu i mierzysz rzeczy w przypadkowych momentach. Pytanie brzmi, czy gromadzone dane są systematycznie stronnicze. Umożliwia to losowe próbkowanie, ale nie jest to jedyny sposób na osiągnięcie tego celu i jest zwykle wysoce nieefektywne.
@bon Przyjrzę się temu, ale w tej chwili w to nie wierzę. Wszystkie statystyki, które widziałem, wymagają losowego próbkowania (wiele losowych lokalizacji, chociaż używanie ekstremów [wzloty / upadki] byłoby w porządku).
@BarryCarter Jeśli mierzę temperaturę w pomieszczeniu, czy próbuję pobierać próbki losowo?
@bon Nie, ale jeśli próbujesz pobierać próbki w pobliżu otworu wentylacyjnego lub okna, nie możesz twierdzić, że odczyt temperatury dokładnie odzwierciedla rzeczywistą średnią temperaturę w pomieszczeniu. Jest to jeden z powodów, dla których ustawienie termostatów na wyższą lub niższą od żądanej temperatury w rzeczywistości działa: termostat nie mierzy dokładnie temperatury w pomieszczeniu.
http://chat.stackexchange.com/rooms/53769/non-random-sampling
@BarryCarter Oczywiście, że nie. Pobieranie próbek w pobliżu okna byłoby wyraźnym przykładem systematycznego błędu, ale jest to całkowicie niezależne od tego, czy próbka jest losowa, czy nie. Dopóki rozpoznajesz systematyczne odchylenie i poprawiasz je, nie ma problemu z pomiarem.
user7733
2017-03-18 06:48:16 UTC
view on stackexchange narkive permalink

Nie, nie są reprezentatywne. Z naukowego punktu widzenia nie jest idealny. Nie zaczynałbyś od tego, gdybyś miał dzisiejszy plan, ALE to wszystko, co masz. Kiedy masz niedoskonałe dane, musisz być uczciwy i wskazać na ich niedoskonałości oraz, jeśli to możliwe, obliczyć lub oszacować wpływ tych niedoskonałości na Twoje wyniki / wnioski. To, czy sprytni klimatolodzy zrobili to w niezbędnym stopniu, jest poza mną (może to nie jest poza tobą?). Wczesne raporty IPCC wydawały się zawierać wiele „niepewnych” „niejednoznacznych” komentarzy „niewystarczających danych”, ale ich liczba oczywiście nieco się zmniejszyła. Przyczyną nie są lepsze dane historyczne, nadal masz te same stare dane, które miałeś wcześniej , ale wyraźnie lepsze „leczenie”. To, czy dane były torturowane przez ludzi czy układy scalone, jest znowu poza mną. Być może w ogóle nie był torturowany. Gdybyśmy chcieli zbadać więźnia, który twierdził, że był torturowany, kiedy strażnicy powiedzieli, że „go nie dotykali, gov!”. Patrzyliśmy pod jego ubraniem na jego skórę. Więc poproś klimatologa, aby pokazał ci, jak dokładnie potraktował swoje dane, zdjął zewnętrzną warstwę ubrań i poproś o wyjaśnienie tych śladów siniaków. Bądź podejrzliwy wobec każdego, kto twierdzi, że był to wypadek podczas gry w hokeja.



To pytanie i odpowiedź zostało automatycznie przetłumaczone z języka angielskiego.Oryginalna treść jest dostępna na stackexchange, za co dziękujemy za licencję cc by-sa 3.0, w ramach której jest rozpowszechniana.
Loading...