Datowanie radiowęglowe Adam Walanus, Tomasz Goslar     Spis treści

Kalibracja metody 14C

Kalibracja, bardzo potrzebna, jest jednocześnie kłopotliwa. Po pierwsze kalibracja pojawiła się na pewnym etapie rozwoju metody, w literaturze funkcjonuje więc dużo wyników pomiarów sprzed wprowadzenia kalibracji, są to tzw. konwencjonalne oznaczenia wieku (daty konwencjonalne). Słowo „konwencja” oznacza tu umowę; wiemy, że nie jest to rzeczywisty wiek, a tylko wynik pomiaru 14C. Inna trudność polega na tym, że wynik pomiaru z uwzględnieniem kalibracji ma dość skomplikowaną formę (Walanus 2005).

Nie ulega jednak wątpliwości, że metoda 14C pomiaru wieku zawiera kalibrację jako swój konieczny element. Końcowym wynikiem pomiaru jest wiek kalibrowany, czyli po prostu wiek (nazywany też czasem wiekiem kalendarzowym lub astronomicznym). Kalibracja nie jest alternatywą, a przyrodniczą koniecznością.

Tu jest najprostszy program do kalibracji dat.

Pojęcie kalibracji

Kalibracja, wg słownika wyrazów obcych to „sprawdzanie wskazania przyrządów pomiarowych (np. wagi, termometru, linijki, zegara) przez porównanie ze wskazaniami przyrządu wzorcowego”.

       

Zesta odważników, które mogą służyć do sprawdzenia i wykalibrowania wagi elektronicznej bądż sprężynowej. Po prawej; kalibracja monitora, by wyświetlał kolory takie jak w rzeczywistości. Odważniki pełnia rolę taką jak wzorcowe, kolorowe pola na monitorze - wiemy co sobą reprezentują, a interesuje nas jak interpretuje je przyrząd (metoda radiowęglowa).

Co prawda, laboratorium radiowęglowego raczej nie nazwiemy przyrządem pomiarowym, ale poza tym przytoczona definicja nadaje się dobrze do wyjaśnienia pojęcia, które jest tytułem tego rozdziału. W metodzie 14C chodzi o pomiar wieku, czyli czasu. Czas mierzymy, odczytujemy codziennie wielokrotnie, a niekiedy kalibrujemy nasz przyrząd pomiarowy – ręczny zegarek. Nie jest to typowa kalibracja, raczej korekta. Polega na przesunięciu wskazówek zegarka tak, by pokazywał czas zgodny z odczytem z przyrządu wzorcowego, podawanym zwykle przez radio. Niektóre zegarki same, bez wiedzy właściciela kontaktują się drogą radiową ze znacznie dokładniejszym zegarem należącym zapewne do jakiejś służby astronomicznej. Tak to też powinno być w przypadku datowań 14C, kalibracja powinna być wykonywana automatycznie.

Dendrochronologia i inne niezależne „zegary” przyrodnicze

Do kalibracji zegarka używamy lepszego zegara z witryny zegarmistrza (time and date). Skąd jednak wziąć zegar lepszy od metody 14C? W początkach używania metody, poza wiedzą historyczną i archeologiczną nie było innego, lepszego, niezależnego zegara. Pomiary wieku wykonywano więc na podstawie znajomości prawa rozpadu i okresu połowicznego zaniku izotopu 14C. Ponadto zakładano, że stężenie 14C w atmosferze w ciągu ostatnich 40 tys. lat było stałe. Nie było innego wyjścia. Z czasem jednak, równolegle z rozwojem metody 14C rozwinęły się również inne metody pomiaru wieku. Nie zawsze jednak dają się one zastosować tam, gdzie stosuje się metoda 14C.

Najdokładniejszą znaną metodą pomiaru wieku jest metoda dendrochronologiczna (Zielski, Krąpiec 2004). Ze względu na wyraźną w naszym klimacie roczną zmienność temperatury (zima – lato) drzewa przyrastają w sposób nieciągły, skokowo, wytwarzając tzw. słoje roczne. Znajdując w lesie pień ściętego drzewa łatwo (patrz zdjęcie niżej) liczymy słoje, od zewnątrz, dochodząc do słoja, który powstał w roku naszych urodzin, a w przypadku grubszego drzewa wskażemy słój z roku 1939, a może i z 1900. Są w Polsce stare dęby, w Ameryce rosną długowieczne sekwoje, wystarczy wziąć drewno ze słoja z roku, na przykład 1500 AD, możliwie dokładnie wykonać pomiar 14C (którego wynik będzie np. 350±20 BP) i otrzymujemy w ten sposób jeden punkt kalibrujący 1500 AD - 350 BP.

Datowanie Radiowęglowe

Słoje rocznych przyrostów w świeżo ściętym drzewie.

Zostawmy jednak na razie kwestię kalibracji 14C, pozostańmy przy dendrochronologii. Otóż zasięg czasowy tej metody jest znacznie większy niż wiek najstarszych żyjących drzew.

Podstawą dendrochronologii jest sezonowa zmienność zima-lato, jednak kolejne lata też różnią się między sobą. Bywają lata gorące i zimne, suche i deszczowe. Drzewa różnie reagują na różne warunki. W czasie krótkiego, zimnego lata powstaną cienkie słoje. Następny „dobry” rok da słój gruby i tak powstaje charakterystyczna sekwencja słojów. By przekonać się, że słoje rocznych przyrostów drzew nie są jednakowe, wystarczy popatrzeć na jakiś drewniany mebel.

W ściętym dziś drzewie, blisko jego środka znaleźć możemy sekwencję słojów gruby-gruby-cienki-gruby-cienki, itd. Najstarszy słój sekwencji pochodzić może np. z roku 1850 AD. Weźmy teraz belkę z konstrukcji starego kościoła, być może znajdziemy w niej taką samą sekwencję grubości słojów. W takim wypadku będziemy w stanie wskazać również słój z roku 1850 AD. Idąc od tego słoja na zewnątrz dojdziemy do najmłodszego słoja belki, wskazującego, być może na rok budowy kościoła (a w każdym razie rok ścięcia drzewa). Jeżeli belka była gruba, a charakterystyczna sekwencja słojów to były jej najmłodsze słoje, to być może uda się w belce tej znaleźć inną charakterystyczną sekwencję, w pobliży środka belki, która pochodziła już będzie z lat, na przykład 1700 AD – 1730 AD. I tak posuwamy się w głąb dziejów, zachowując roczną dokładność pomiaru czasu.

W osadach rzecznych znajdowane są dęby o wieku kilku tysięcy lat. Zasięg metody dendrochronologicznej wynosi dziś ok. 10 tys. lat, zależnie od regionu geograficznego. Granica ta wiąże się z zasadniczą zmianą klimatu, jaka miała miejsce na przełomie okresu zlodowacenia i holocenu. Wcześniej, na terenie Polski za zimno było dla dębów.

Znajdując kolejne drzewa nie tylko przedłuża się tzw. chronologie, ale poprawia się również dokładność ciągu grubości słojów. Końcowym efektem jest zapis grubości uśredniony, nawet dla setek drzew. W laboratorium dendrochronologicznym mierzy się grubości słojów z dokładnością do setnej części milimetra. W próbce drewna do pomiaru wieku, poszukuje się najdłuższej, dostępnej w niej sekwencji słojów, by po ich zmierzeniu dopasować otrzymaną sekwencję liczb do odpowiedniej „chronologii”. W przypadku znalezienia statystycznie istotnego dopasowania otrzymujemy wiek próbki.

W pewnym stopniu analogiczną do dendrochronologii jest metoda liczenia rocznych przyrostów osadu jeziornego (tzw. warw). W pewnych, bardzo szczególnych warunkach, na dnie jeziora szczątki mineralne i organiczne osadzają się w tak spokojny sposób, że zachowany zostaje rozdział pomiędzy tym co osadza się latem a osadem zimowym. Próbki takiego osadu pobrano m.in. z jeziora Gościąż w Kotlinie Płockiej (Walanus 1994) i zawierają one ponad 12 tysięcy par warstw letnio-zimowych (zwanych warwami). Osad ten posłużył do uzupełnienia kalibracji metody 14C (Goslar i inni 1995).

Roczne przyrosty obserwowane są też w koralowcach żyjących w ciepłych wodach oceanicznych.

Inną grupą metod pomiaru wieku o zakresie dziesiątków tysięcy lat są metody izotopowe, podobne do 14C, lecz niezależne, gdyż wykorzystujące inne pierwiastki, o zupełnie innych własnościach chemicznych niż węgiel. Jest to przede wszystkim metoda uranowo-torowa (230Th/234U). Podstawowa idea jest tu podobna jak w 14C, jednak o ile okres połowicznego zaniku 14C wynosi 5 tys. lat, to okres połowicznego zaniku 230Th wynosi 75 tys. lat. Metoda uranowo-torowa może więc wspomóc metodę węglową na krańcach jej zasięgu, w zakresie wieku liczonego w dziesiątkach tysięcy lat.

Idea kalibracji metody radiowęglowej

Kalibracja metody pomiarowej polega na porównaniu pomiarów z innymi, dokładniejszymi pomiarami. Na pytanie, dlaczego zawsze nie używać tych dokładniejszych metod, odpowiedź jest prosta. Poszczególne metody działają w pewnych, konkretnych warunkach, mają konkretne wymagania. I tak metoda 14C potrzebuje węgla, dendrochronologia wymaga pnia drzewa lub deski, metoda uranowo-torowa dotyczy np. węglanowych nacieków jaskiniowych itd. Jeżeli zachodzi szczególna sytuacja, że stosowalne są dwie różne metody, to można je między sobą porównać, co zasadniczo przyczynia się do poprawy wiarygodności wyniku datowania.

Podstawą aktualnej kalibracji metody 14C są pomiary dendrochronologiczne. Drewno jest materiałem bardzo dobrze nadającym się do pomiaru 14C. Dendrochronologia jest więc idealnym narzędziem kalibracji metody 14C. Aktualna kalibracja bazuje na wynikach tysięcy pomiarów 14C próbek słojów drzew o wieku wyznaczonym dendrochronologicznie. Pomiary 14C tych próbek wykonywane były wyjątkowo dokładnie, w najlepszych laboratoriach. W pomiarach tych osiągano najmniejszą możliwą niepewność pomiarową, dochodząc do ±20 a nawet ±10 lat.

Jedna zbadana w ten sposób próbka daje dwie liczby: rzeczywisty wiek (wiek dendrochronologiczny) i wiek 14C (konwencjonalny). Te dwie liczby zamieścić można w jednym wierszu tabeli o dwóch kolumnach lub na zwykłym, dwuwymiarowym wykresie.

Datowanie Radiowęglowe

Dane kalibracyjne przedstawione w formie tabeli i wykresów. W pierwszej kolumnie tabeli podany jest wiek rzeczywisty (kalendarzowy, kalibrowany). Wiek kalendarzowy (CalBP) jest liczony od roku 1950. W drugiej kolumnie tabeli podane są wyniki pomiarów 14C próbek o wieku z pierwszej kolumny, jest to tzw. wiek radiowęglowy. Trzecia, dodatkowa kolumna tabeli zawiera niepewności pomiarowe wyników z drugiej kolumny . Pierwszy wykres jest najprostszym, graficznym przedstawieniem danych z dwóch głównych kolumn tabeli. Drugi wykres, pochodzący z Oksfordzkiego programu OxCal v. 3.10 (Bronk Ramsey 2001) ilustruje ponadto dokładność krzywej kalibracyjnej, uwzględniając niepewności pomiarowe z trzeciej kolumny tabeli. Dane wg Reimer i inni 2004.

Zwrócić należy uwagę na logiczną kolejność dwóch wielkości: wieku rzeczywistego i wieku 14C. Pierwszeństwo oczywiście ma wiek rzeczywisty. Tak więc, każdemu wiekowi rzeczywistemu (np. 5130 CalBP, czyli 3180 BC) odpowiada dokładnie jeden wiek 14C (jak widać z tabeli, 4503). Trzecia kolumna tabeli albo szerokość pasa z wykresu po prawej wskazują, że dokładność, z jaką określono wiek próbek kalibracyjnych wynosi ok. ±14 lat.

Odwrotny kierunek logiczny, czyli pytanie, jaki jest rzeczywisty wiek, jeżeli wiek 14C wynosi np. 4430 BP jest znacznie trudniejszy, tu nie ma jednoznacznej odpowiedzi. Jest wiele różnych dat, które dają wiek 14C równy 4430 BP i nie dotyczy to jedynie tego, konkretnego przykładu. Z pierwszego wykresu odczytać można, że wartości 4430 BP odpowiada data 5040 BP albo seria dat od 5010 do 4980 BP.

Jak postępować w takiej sytuacji? Być może każda z ośmiu dat kalendarzowych (liczonych co 5 lat) jest tak samo prawdopodobna? Nie ma sensu zajmować się takimi pytaniami w oderwaniu od faktu, że wiek konwencjonalny obarczony jest niepewnością pomiarową i nie wynosi on dokładnie 4430 BP, a raczej, na przykład 4430±50 BP.

Kalibracja z uwzględnieniem niepewności pomiarowej

Obiekt wysłany do laboratorium radiowęglowego w celu wyznaczenia wieku ma jakiś wiek. Można sobie wyobrazić geologa, albo lepiej w tym przypadku dendrochronologa, zlecającego pomiar, który przypuszcza, że słój drzewa pochodzi dokładnie z roku 5280 BP (czyli 3330 BC). Załóżmy, że słój ów rzeczywiście pochodzi z tego roku, choć założenie to ma jedynie ułatwić skupienie uwagi w następującym toku rozumowania.

Zapytajmy, jaki wiek 14C „powinna” dać próbka o rzeczywistym (kalendarzowym) wieku 5280 BP? Używając tabeli 8, lub wykresu z krzywą kalibracyjną odczytamy, że wiekowi 5280 BP odpowiada wiek „radiowęglowy” wynoszący ok. 4500 BP. Zwróćmy uwagę, że posługiwanie się krzywą kalibracyjną w kierunku: od daty kalendarzowej (kalibrowanej) do daty 14C, nie prowadzi do niejednoznaczności. Otrzymany wiek 4500 BP jest jedynym odczytanym wiekiem, choć trzeba pamiętać o ograniczonej dokładności tej wartości, która ze względu na precyzję samej krzywej kalibracyjnej jest rzędu ±10 lat (dlatego nie upieramy się przy dokładnej wartości 4508).

Datowanie Radiowęglowe

Kalibracja wyniku pomiaru 4430±50 BP (wg programu OxCal). Oś pozioma wykresu jest osią wieku kalendarzowego albo kalibrowanego, oś pionowa jest osią wieku 14C. Zgodnie z konwencją wiek 14C podaje się w skali BP, natomiast wiek kalendarzowy w latach AD/BC albo w latach BP (czyli przed rokiem 1950 AD). Bezpośredni wynik pomiaru 14C ilustrowany jest krzywą dzwonową Gaussa. Linia prowadząca od wieku 5280 CalBP, przez krzywą kalibracyjną do wieku 4500 BP ilustruje sposób przenoszenia gęstości prawdopodobieństwa z krzywej Gaussa na krzywą rozkładu gęstości prawdopodobieństwa wieku kalibrowanego.

Tak więc, przekonany o swojej racji dendrochronolog spodziewa się wyniku pomiaru wieku 4500 BP. Jeżeli dokładność pomiaru będzie wynosiła na przykład ±50 lat, to wynik mógłby mieć postać 4500±50 BP. Oczywiście przyrodnik znający sens niepewności pomiarowej (±50 lat) wie, że wynik, np. 4450±50 BP również nie przeczy jego tezie i nie ma pretensji do laboratorium radiowęglowego. Jak widać na powyższym rysunku, w przypadku wyniku pomiaru 4430±50 BP wiekowi 4500 BP odpowiada całkiem duża gęstość prawdopodobieństwa wg krzywej Gaussa narysowanej na pionowej osi wieku 14C, po lewej stronie wykresu.

W taki sam sposób można sprawdzić stopień potwierdzenia przypuszczeń, że wiek kalendarzowy ma jakąkolwiek inną wartość. Np. dla 5400 BP, wychodząc od tej wartości na osi poziomej, idąc do krzywej kalibracyjnej i dalej, w lewo do osi pionowej, otrzymamy zerową gęstość prawdopodobieństwa, bo w ogóle nie trafiamy w krzywą Gaussa. Tak więc wiek 5400 BP jest nieprawdopodobny.

W taki właśnie sposób otrzymywany jest rozkład gęstości prawdopodobieństwa wieku kalendarzowego, nazywanego też kalibrowanym (Michczyńska, Pazdur, Walanus 1989). Program komputerowy sprawdza wszystkie możliwe wartości wieku (kalendarzowe), czy według otrzymanego wyniku pomiaru (krzywa Gaussa) odpowiada im jakaś sensowna wartość gęstości prawdopodobieństwa, a jeżeli tak to jaka. Odczytaną z krzywej Gaussa wartość program rysuje na osi poziomej wieku kalibrowanego. Tak powstaje skomplikowany rysunek będący wynikiem pomiaru wieku metodą 14C (Walanus 2005).

Już z tytułu tego rozdziału wynika, że duża część zagadnienia kalibracji zdeterminowana jest faktem istnienia niepewności pomiarowej. Niepewność pomiaru wieku 14C widoczna jest na powyższym wykresie w postaci większej lub mniejszej szerokości krzywej Gaussa, która przekłada się na końcowy rozkład prawdopodobieństwa. Jednak sama krzywa kalibracyjna również składa się z wyników pomiarów. Pomiary te były bardzo dokładne i jest ich bardzo dużo, jednak i one obarczone są niepewnością . Na wykresie niepewności te odzwierciedlają się w tym, że krzywa kalibracyjna nie jest linią, a pasem, o nieco zmiennej szerokości. Tak też jest w programie OxCal, gdzie rysowane są tylko dwie linie ograniczające możliwe położenie „prawdziwej” krzywej kalibracyjnej. Sama krzywa jest gdzieś pomiędzy tymi dwiema liniami. Niedokładność kalibracji uwzględniana jest przy otrzymywaniu rozkładu prawdopodobieństwa wieku kalendarzowego.

Interpretacja kalibrowanego wyniku pomiaru 14C

Wynik pomiaru wieku metodą 14C w formie widocznej na rysunku wyżej lub niżej (a), czyli w formie wykresu funkcji gęstości prawdopodobieństwa nie wygląda zbyt zachęcająco. Wynikiem pomiaru powinna, jak się wydaje być liczba; po prostu wiek. To jednak jest niemożliwe, żaden pomiar nie daje dokładnej liczby, wszystkie pomiary w wyniku dają dwie liczby – wynik właściwy i miarę jego niepewności. Wynik pomiaru wieku metodą radiowęglową bez kalibracji ma postać np. 1800±50 BP. Zwróćmy uwagę, że ten zapis w zasadzie należy interpretować jako skrótowy opis funkcji gęstości prawdopodobieństwa. Funkcja ta, jak w większości wszelkich pomiarów jest funkcją Gaussa, jest to rozkład normalny prawdopodobieństwa . Dwie liczby wystarczą żeby jednoznacznie określić rozkład normalny. Po kalibracji sprawa jednak nie jest już tak prosta.

Z powodu skomplikowanego kształtu krzywej kalibracyjnej, z funkcji Gaussa po kalibracji robi się funkcja, która nie daje się opisać żadnym równaniem, a daje się jedynie narysować. Funkcja ta przypomina pasmo górskie z szeregiem niższych i wyższych szczytów.

Datowanie Radiowęglowe

Różne graficzne formy wyniku pomiaru wieku metodą 14C (po kalibracji). Wiek 14C wynosi 1800±50 BP. Wykres funkcji gęstości prawdopodobieństwa (a), przedziały zawierające rzeczywisty wiek z prawdopodobieństwem 68% (b) i z prawdopodobieństwem 95% (c). Gęstość prawdopodobieństwa zilustrowana jako stopień szarości (d) i jako gęstość punktów (e). Skala lat kalendarzowych (f).

Interpretacja rozkładu prawdopodobieństwa wieku (po kalibracji) nie jest tak skomplikowana jak sama postać tego rozkładu. Po prostu, tam gdzie wyżej tam jest większe prawdopodobieństwo. Tam, to znaczy dla niektórych wartości wieku. Na przykład, na rysunku a, powyżej największe prawdopodobieństwo mamy przy dacie 240 AD. Czy to oznacza, że ten wiek jest najbardziej prawdopodobny? Tak, 240 AD jest najbardziej prawdopodobnym wiekiem badanego obiektu. Nie należy jednak do tego faktu przywiązywać zbyt wielkiego znaczenia.

Przypomnijmy, co to jest prawdopodobieństwo. Dobrym przykładem jest w tym temacie sześcienna kostka do gry. Kostka jest symetryczna, ścianek jest sześć, każda jest tak samo prawdopodobna. Pomalujmy dwie ścianki kostki na zielono, a pozostałe cztery na czerwono. Kostka nie jest już symetryczna (tylko w pewnym aspekcie). Prawdopodobieństwo wyrzucenia ścianki czerwonej jest większe niż zielonej. Jest dwa razy większe. Co to znaczy? Oznacza to, że w stu rzutach tą kostką mniej więcej dwa razy częściej pojawi się ścianka czerwona. Rozpatrzmy jednak jeden rzut, tak jak mamy jeden wynik pomiaru wieku jednego obiektu. Wykres (a), dla kostki jest prostszy, byłyby na nim dwa słupki, przy kolorze czerwonym stałby słupek dwa razy wyższy niż przy kolorze zielonym. Pomyślmy, co to oznacza dla sytuacji pojedynczego rzutu kostką. W tym jedynym rzucie oczywiście możemy otrzymać ściankę zieloną, mimo, że jest dwa razy mniej prawdopodobna. Argumentacja taka może wydawać się podejrzana, przecież w LOTTO prawie z na pewno nie wygramy. Prawdopodobieństwo wygrania miliona złotych w tej grze jest rzędu jednej dziesięciomilionowej. Jeżeli z dwóch wyników jeden jest milion razy mniej prawdopodobny, albo dwadzieścia razy mniej prawdopodobny (1/20=0,05 – często stosowany poziom istotności), to przy jednej próbie rzeczywiście ma to znaczenie. Jeżeli jednak prawdopodobieństwo wynosi 1/3, to, przy pojedynczym rzucie kostką nie jest aż tak ważne, że nie wynosi 1/2. I tak liczyć się musimy z możliwością zielonej ścianki. (Trzeba 36 rzutów by statystycznie stwierdzić, że mamy do czynienia z kostką z dwiema tylko, a nie trzema zielonymi ściankami.)

Na wykresie z powyższym rysunku (a) między 140 AD a 260 AD mamy „płaskowyż”. Dołek w płaskowyżu w okolicy 200 AD jest 1,3 razy mniej prawdopodobny niż szczyt. Tak więc, wiek 200 AD jest zaledwie 1,3 razy mniej prawdopodobny niż wiek 240 AD, nie stanowi to podstawy do wyciągania poważnych wniosków. Chyba, że prowadzimy ścisłe rozumowanie statystyczne i na temat dat 200 AD i 240 AD mamy już pewne opinie, które potrafimy skwantyfikować. Jeżeli, np. wiemy skądinąd, że młodsza data jest dwa razy mniej prawdopodobna od starszej, to uwzględnienie (za pomocą twierdzenia Bayesa) otrzymanego tu ilorazu prawdopodobieństw równego 1,3 będzie nie od rzeczy.

Jednak w typowej sytuacji cały płaskowyż 140 – 260 AD traktować możemy jako obszar jednakowego prawdopodobieństwa, że rzeczywisty wiek znajduje się gdzieś między 140 AD a 260 AD. Zapytać można jednak ile wynosi to prawdopodobieństwo ilustrowane przez „górę” ze względnie płaskim szczytem. Otóż jest ono takie jak obszar widoku owej góry, w stosunku do całego obszaru wykresu. Patrząc na wykres (a) możemy, „na oko” ocenić, że między 140 AD a 260 AD mamy nieco ponad połowę prawdopodobieństwa. Czy jesteśmy zdani na oceny „na oko”, ewentualnie na drukowanie wykresu na papierze milimetrowym i liczenie kratek? Odpowiedź na to pytanie zawarta jest w opisie do powyższego rysunku (b i c).

Paski na rysunku b i c to dwie, alternatywne, prostsze formy prezentacji wyniku pomiaru 14C. Jak można się domyślić paski te wskazują na pewne zakresy wieku, np. dwa paski z rysunku b oznaczają przedziały 130 – 260 AD i 300 – 320 AD. Domyślać się można również, patrząc na wykres (a), że jest to przedział odpowiadający najbardziej prawdopodobnym wartościom wieku. Otóż paski z wykresu (b) odpowiadają prawdopodobieństwu wynoszącemu 68%. Tak więc prawdopodobieństwo, że rzeczywisty wiek zawiera się w przedziałach 130 – 260 AD lub 300 – 320 AD wynosi 68%; takie właśnie jest prawdopodobieństwo dla przedziału 1800±50 BP wieku „radiowęglowego”. Przypomnijmy, że przykładowe ±50 to niepewność pomiarowa 1σ. Ktoś mógłby zauważyć, że można znaleźć wiele różnych kombinacji przedziałów, takich, że łączne prawdopodobieństwo wynosiłoby dla nich 68%. Oczywiście wybiera się te przedziały, które odpowiadają najbardziej prawdopodobnym wartościom wieku, są to jednocześnie najkrótsze (w sumie) przedziały.

Prawdopodobieństwo 68% nie jest zbyt duże, to zaledwie ok. 2/3. Czyli prawdopodobieństwo, że rzeczywisty wiek znajduje się w tych przedziałach jest zaledwie dwa razy większe od prawdopodobieństwa, że jest poza nimi. Możemy żądać większej pewności. Zajrzyjmy do tabeli 4, tak się dobrze składa, że niepewności 2σ odpowiada całkiem „równe” prawdopodobieństwo 95%. Tak otrzymujemy przedziały z rysunku c. Przedziały te prawie na pewno zawierają rzeczywisty wiek, zaledwie w 5% przypadków będzie inaczej.

Prowadząc tak precyzyjne probabilistyczne wnioskowania pamiętajmy, że wszystko to zachowuje moc o ile niepewność pomiarowa wieku 14C (owe, przykładowe ±50) jest obliczona poprawnie, oraz, że nie ma żadnych innych odchyleń, które nie zostały włączone do obliczonej niepewności. Podawana wartość niepewności jest z zasady minimalną wielkością niepewności. Rzeczywista niepewność nie może być mniejsza, za to może być większa.

Przedziały na rysunkach b i c mają ostre granice, można by powiedzieć: rażąco ostre. Dlatego, w tym aspekcie lepszy jest wykres a, widzimy tam, że nie ma takich granic, skłony gór, nawet jeżeli są strome to nie są pionowe.

Jednak ten wykres też ma ostre granice, wysokość gór jest tu zupełnie jednoznaczna, „twarda” jak grań tatrzańska. A to przecież tylko prawdopodobieństwo. Owszem, prawdopodobieństwo może wynosić np. dokładnie 0,008765, ale to tylko prawdopodobieństwo. Wielkość ta nie ma tak bezwzględnego charakteru jak np. profil terenu. Niepewność jest immanentną cechą prawdopodobieństwa. Prawdopodobieństwo samo przecież jest niepewnością.

Zaproponować można więc (Walanus 1997) jeszcze inne przedstawianie wyniku pomiaru wieku metodą 14C, łączące zalety dwóch już omówionych. Prawdopodobieństwo przedstawić można jako poziom szarości (wykres (d)), albo jeszcze lepiej jako gęstość punktów (wykres (e)). Ten ostatni sposób bezpośrednio wskazuje na prawdopodobieństwo trafienia punktu – rzeczywistego wieku w daną wartość. Stopień szarości lub niewiele się od niego różniąca gęstość punktów zachowują w zasadzie precyzję prawdopodobieństwa nie dając jednocześnie szans na dokładne odczytanie wartości, zabezpieczając wynik przed wyciąganiem z niego nadmiernie precyzyjnych, pozornie dokładnych wniosków.

Pamiętając, jaka jest interpretacja niepewności pomiarowej, czyli liczby 50 w wyniku 1800±50 BP, musimy dopuścić, że całkiem prawdopodobne było, że zamiast tego wyniku otrzymalibyśmy na przykład wynik 1850±50 BP albo 1750±50 BP. Co więcej, gdybyśmy drugą, identyczną część naszej próbki wysłali ponownie do laboratorium, to niemal na pewno nie otrzymamy drugi raz wyniku 1800±50 BP, a raczej inne liczby, typu wyżej przytoczonych. Zobaczmy więc, jak różnią się te wyniki po kalibracji.

Datowanie Radiowęglowe

Trzy rozkłady prawdopodobieństwa, które z niemal jednakowym prawdopodobieństwem możemy otrzymać jako wynik pomiaru wieku obiektu o wieku radiowęglowym 1850 BP, przy niepewności ±50 lat. Pamiętajmy, że nawet w idealnym przypadku, średnio jeden na trzy wyniki będzie się różnił od 1850 BP o ponad 50 lat. Kalibracji dokonano za pomocą programu OxCal.

Z powyższego rysunku i podanych na nim liczb, oraz z sensu niepewności pomiarowej wynika, że nie należy upierać się, że 95-procentowy przedział wieku, dla badanego obiektu, wynosi dokładnie: 80-110 AD lub 120-390 AD. Niemal równie dobrze mogliśmy otrzymać inny przedział dwudzielny: 50-260 AD lub 300-330 AD albo przedział monolityczny: 130-410 AD. Jasne więc, iż upieranie się, że przedział 110-120 (pierwszy przypadek) na pewno jest wyłączony, nie jest wskazane. Przedział dwudzielny 80-110 AD lub 120-390 AD należy uprościć w cytowaniach do 80-390 AD. To, czy w taki sam sposób postąpić z przedziałem 50-260 AD lub 300-330 AD (drugi przypadek), gdzie przerwa jest szersza i wynosi 40 lat, nie jest już tak oczywiste. Jednak konstatacja faktu, że na trzecim rozkładzie na powyższym rysunku, w okresie tejże 40-letniej przerwy rozkład ma wręcz maksymalne wartości, powinien ułatwić decyzje idącą w kierunku uproszczenia wyniku.

Rodzi się pytanie, jak określić przedział wieku kalibrowanego, gdy rzeczywiście dysponujemy kilkoma wynikami datowania tej samej próbki. Sytuacja zilustrowana na powyższym rysunku zachęcałaby do „ostrożnego” podania przedziału możliwie najszerszego, tj. 50-410 AD. Byłoby to niezbyt poprawne, gdyż niepewność pomiarowa zostałaby tu uwzględniona dwukrotnie. W sytuacji, gdy mamy kilka dat 14C próbek, o których wiemy, że są równowiekowe, poprawne jest najpierw obliczenie średniego wieku 14C. W naszym przykładzie średni wiek 14C znów wyniesie 1800 BP (czyli tyle ile pierwszy z pojedynczych wyników), ale jego niepewność będzie mniejsza od niepewności pojedynczych dat (w tym przypadku: ±30). I dopiero tak obliczony średni wiek 14C (1800±30 BP) należy wykalibrować. Wynik tej operacji da 95% przedział lat kalendarzowych: 120-260 AD lub 280-330 AD. Rozsądnie będzie scalić ten przedział do 120-330 AD. Warto zauważyć, że jest on i tak wyraźnie węższy od „ostrożnie” oszacowanego 50-410 AD.

Odczytanie rozkładu prawdopodobieństwa wyniku pomiaru wieku metodą 14C nie jest banalne. Może jednak, właśnie tym bardziej zobowiązuje osobę podającą w swej pracy wynik pomiaru do podjęcia trudu rzetelnego zinterpretowania wyniku, tak by podać go w prostej postaci, nie tracąc przy tym ścisłości. Zamieszczanie in extenso wyniku pomiaru w postaci wykresu skopiowanego z programu kalibrującego jest unikiem.

Wydaje się, że godnym zalecenia sposobem cytowania kalibrowanego wyniku pomiaru wieku metodą 14C jest podawanie:

granic ciągłego przedziału 95%.

Na przykład:

80-390 AD.

Podawanie nieciągłego przedziału, przerywanego czasami odcinkami o mniejszym prawdopodobieństwie, które jest domyślną opcją programu OxCal, wydobywa maksimum informacji z rozkładu prawdopodobieństwa. Na poniższym zrzucie ekranowym pokazany jest sposób przełączania programu Ocal na przedziały bez przerw.

Datowanie Radiowęglowe

Program Ocal v. 4.1; opcje.

Jednak z założenia, podawanie przedziału zamiast samego rozkładu, w postaci wykresu, jest ograniczeniem ilości przekazywanej informacji. Jak daleko posunąć to ograniczenie, którego celem jest poprawa przejrzystości, jest subiektywną decyzją, dla której nie ma żadnych matematycznych uzasadnień. Niektóre programy kalibracyjne (Sharon 2001) podają raczej ciągłe, nie przerywane przedziały, ułatwiając nieco życie ich użytkownikom.

 

Czy wynikiem datowania 14C mogłaby być jedna liczba?

Wynik jakiegokolwiek, typowego pomiaru, jakich miliony wykonuje się w przemyśle, oraz tzw. konwencjonalny wynik pomiaru wieku metodą 14C mają taką samą postać. Podaje się po prostu wynik i oczywiście niepewność pomiarową, np. 12,3±0,4 mm czy 1230±40 BP. Natomiast kalibrowany wynik pomiaru wieku to przedział, podany poprzez swoje granice. Dlaczego nie podaje się jednej liczby, np. środka przedziału? W typowych pomiarach wynik opisywany jest symetryczną krzywą Gaussa; nie ma wątpliwości gdzie jest jej środek. Inaczej jest po kalibracji.

Są takie, względnie gładkie fragmenty krzywej kalibracyjnej, że otrzymany rozkład prawdopodobieństwa jest dość skupiony. Nie będzie on nigdy miał idealnego kształtu krzywej dzwonowej, ale może stanowić jednolity blok. W takiej sytuacji sens mogłoby mieć odczytanie takiego wieku, że połowa rozkładu leży po jego lewej, a połowa po prawej stronie. Taka wartość (taki wiek) nazywa się medianą. Z prawdopodobieństwem ½ rzeczywisty wiek może być mniejszy niż mediana i z takim samym prawdopodobieństwem może być większy. Mediana jest w środku. Medianę zawsze da się obliczyć, zawsze będzie istniał wiek dzielący rozkład na połowy. Jednak mogą się zdarzyć takie wyniki pomiaru wieku, trafiające w takie części krzywej kalibracyjnej, że przyjęcie mediany jak głównego wyniku budziłoby kontrowersje. Przykład taki pokazany jest na poniższym rysunku A. Mediana ma tu wartość ok. 240 BC i wypada w „dolinie” rozkładu, tak więc, akurat mediana jest stosunkowo mało prawdopodobna. Właśnie podawanie jako „głównego”, pojedynczego wyniku wartości, która jest znacznie mniej prawdopodobna od innych wartości z przedziału obejmującego 95% rozkładu jest trudne do zaakceptowania. Równocześnie, nie można powiedzieć, by podanie jako wyniku, dla przypadku z rysunku A wartości 240 BC było błędne. Jeżeli jednocześnie podano by wartość niepewności (wynoszącej, zależnie od interpretacji ok. 100 lat), to odbiorca wyniku powinien sobie uświadamiać, że nie chodzi przecież dokładnie o wiek 240 BC, a o pewien zakres, w którym mieści się rzeczywisty wiek. Dodatkowy kłopot wynika jednak z faktu, że należałoby podawać niesymetryczną niepewność. Rozkład z rysunku A jak większość rozkładów prawdopodobieństwa kalibrowanego wyniku pomiaru wieku nie jest symetryczny. Przedział zawierający 95% prawdopodobieństwa jest, w tym przypadku następujący 360 BC-110 BC. Tak więc, należałoby podać wynik jako 240+120-130 BC. W tym konkretnym przypadku można się zgodzić na 240±130 BC, jednak zdarzałyby się sytuacje z tak różnymi niepewnościami na „+” i na „-”, że konieczne byłoby podawanie obu wartości. W tym momencie warto przypomnieć, że w przypadku konwencjonalnych wyników, dla starych próbek rozkład prawdopodobieństwa również nie jest symetryczny i podaje się inną niepewność z plusem, a inną z minusem.

Zgodzić się jednak trzeba, że wynik w postaci 240+120-130 BC nie jest prostszy od wyniku 360 BC-110 BC, mimo, że ten ostatni nie zawiera explicite jednej, głównej wartości, którą można by traktować jako wynik pomiaru wieku.

Datowanie Radiowęglowe

Rozkłady prawdopodobieństwa dla wyników pomiarów 14C 2170±30 (A) i 2390±30 (B). Na wykresie A mediana rozkładu (wskazana strzałką), czyli wielkość dzieląca rozkład na połowy, przypada na wiek mało prawdopodobny. Wykres B wskazuje jak mylące mogłoby być podawanie jako wyniku wieku najbardziej prawdopodobnego, czyli 400 BC (strzałka), podczas gdy zdecydowana większość prawdopodobieństwa odpowiada datom starszym, aż do 760 BC.

Poza medianą jest jeszcze inna wielkość statystyczna, bardzo zgodna z intuicją, która mogłaby kandydować do miana „głównego” wyniku pomiaru wieku. Wartość ta w statystyce nazywa się modą, a jest to wartość najbardziej prawdopodobna. Wiek modalny to ten, dla którego rozkład prawdopodobieństwa osiąga swój absolutny szczyt. Podawanie jako wyniku wartości najbardziej prawdopodobnej wydaje się nie mieć wad. Popatrzmy na rysunek A, jak widać jest tu kilka szczytów mniej więcej równych. Oczywiście zawsze dałoby się, wskazać, który na prawdę jest najwyższy. Popatrzmy więc na rysunek B, gdzie nie ma wątpliwości. Moda wynosi tu 400 BC. Jakim jednak zafałszowaniem wyniku byłoby powiedzenie, że wiek jest 400 BC podczas gdy prawie cała masa prawdopodobieństwa leży w po lewej stronie tej wartości i wskazuje na wiek większy, nawet 750 BC. W tym wypadku, konsekwentnie należałoby napisać 400+360-10 BC.

Warto tu, również zwrócić uwagę, że wysokość „szczytów” rozkładu prawdopodobieństwa nie może być bezpośrednio interpretowana jako prawdopodobieństwo. Prawdopodobieństwo to pole zaczernionej powierzchni na wykresie, a nie rzędna, czyli wysokość szczytu czy doliny. Najwyższa „góra” na rysunku B obejmuje okres czasu ok. 12 lat. Na ten okres przypada prawdopodobieństwo podobne jak na okres 760 BC-690 BC. Nie ma więc podstaw aby wyróżniać wiek ok. 400 BC, na niekorzyść wieku ok. 680 BC. (Patrz też: Michczyński 2007, oraz Telford i in., 2004.)

 

Twierdzenie Bayesa

Wspominany już wielokrotnie, logiczny kierunek wnioskowania o wieku jest następujący: badany obiekt ma pewien wiek, w związku z czym wynik pomiaru da zapewne wartość wieku bliską, choć nie dokładnie taką jak ów wiek rzeczywisty. Tymczasem konieczne jest odwrócenie zagadnienia: znamy wynik pomiaru, a pytamy o rzeczywisty wiek obiektu.

Do odwrócenia kierunku wnioskowania (przykład tzw. zagadnienia odwrotnego) służy twierdzenie Bayesa. Metoda Bayesa jest coraz szerzej wykorzystywana w naukach przyrodniczych. A spośród nauk niematematycznych wiodąca jest tu archeologia, przynajmniej w liczbie publikacji (Buck i inni 1996, Buck i inni 1991). Dlatego, być może warto przypomnieć, jakie są podstawy tego ścisłego sposobu ilościowego wnioskowania. Będzie to temat z dziedziny rachunku prawdopodobieństwa, jednak nie wymagający wyższej matematyki.

           

Ilustracja dwóch możliwych zdarzeń A i B, na tle całości możliwych zdarzeń Ω. Zdarzenie może polegać na tym, że rzeczywisty wiek obiektu wynosi 1234 lat.
Po prawej; sam Thomas Bayes, wg Wikipedii.

Prawdopodobieństwo, że słaby strzelec trafi w obszar A, na powyższym rysunku, o ile w ogóle trafił w tarczę, czyli w kwadrat Ω, równe jest ilorazowi powierzchni obszaru A (nazwijmy tę powierzchnię SA) przez całą powierzchnię tarczy SΩ. Tak więc P(A)=SA/SΩ. Mimochodem pojawiło się tu już pojęcie prawdopodobieństwa warunkowego, ważne w twierdzeniu Bayesa. Otóż P(A) to prawdopodobieństwo trafienia w A, pod warunkiem, że strzelec trafił w Ω. Nie wiemy jakie jest prawdopodobieństwo trafienia w Ω. Podobnie obliczyć możemy prawdopodobieństwo trafienia w A pod warunkiem, że trafiono w B. Jak widać A i B mają część wspólną, tak więc możliwe jest, że trafiono w A, przy założeniu, że na pewno trafiono w B. Część wspólna A i B to „iloczyn” tych zdarzeń, oznaczany jako A∩B. Prawdopodobieństwo warunkowe (A pod warunkiem, że B) oznaczamy w taki sposób: P(A|B). To prawdopodobieństwo też będzie równe ilorazowi dwóch powierzchni: P(A|B)=SA∩B/SB. Jeżeli podzielimy licznik i mianownik tego ułamka przez SΩ to będziemy mogli napisać: P(A|B)=P(A∩B)/P(B). Podobnie możemy obliczyć prawdopodobieństwo B, pod warunkiem, że A: P(B|A)=P(A∩B)/P(A). Kombinując te dwa wzory razem otrzymujemy końcowy wzór (w którym gwiazdka oznacza zwykłe mnożenie liczb).

P(A|B)=P(B|A)*P(A)/P(B).

Powyższy wzór, nazywany twierdzeniem Bayesa, pozwala odwrócić kierunek wnioskowania. Z wnioskowania o B, na podstawie A, przejść możemy do wnioskowania o A na podstawie B. Niech A to będzie rzeczywisty wiek obiektu, a B wynik pomiaru (dokładniej: A to zdarzenie, że wiek wynosi np. 1234 lat, a B to zdarzenie, że w wyniku pomiaru otrzymamy np. 1240 lat). Prawdopodobieństwo P(B|A), otrzymania z pomiaru wyniku B pod warunkiem, że rzeczywisty wiek wynosi A, znają fizycy wykonujący pomiar (stosują tu rozkład prawdopodobieństwa Poissona oraz rozkład normalny). Prawdopodobieństwo P(A|B) to wielkość interesująca archeologa, który pyta: otrzymałem wynik pomiaru B, jakie jest więc prawdopodobieństwo, że wiek obiektu wynosi A, np. 1234 lat? A to właśnie jest P(A|B).

We wzorze na P(A|B) pozostają jednak jeszcze dwa prawdopodobieństwa, P(A) i P(B). Z tym drugim sprawa jest w zasadzie prosta. Stosując podobne jak wyżej przekształcenia otrzymać można następujący wzór: P(B)=P(B|A1)*P(A1)+P(B|A2)*P(A2)+P(B|A3)*P(A3)+..., gdzie Ai to różne daty, czyli zdarzenia, że (hipotetyczny) rzeczywisty wiek wynosi 1234, 1235, 1236 ... lat. W praktyce nie ma konieczności obliczania P(B), gdyż jest to czynnik stały (niezależny od A).

Pewien kłopot jest z czynnikiem P(A), występującym w twierdzeniu Bayesa. Wielkość ta nazywana jest prawdopodobieństwem a priori, czyli ocenianym przed pomiarem wieku. Prawdopodobieństwo a posteriori to P(A|B). Prawdopodobieństwa a priori nie da się obliczyć. Żeby jednak wzór zastosować, coś z tym trzeba zrobić. Najczęściej przyjmuje się, że przed pomiarem praktycznie nic nie wiedzieliśmy o rzeczywistym wieku obiektu, co oznacza, że P(A) ma być takie samo dla wszystkich możliwych wartości wieku (P nie zależy od A). Nie musi to oznaczać, że „zupełnie” nic a priori nie wiemy o wieku, wystarczy, że nasze wstępne informacje o obiekcie są niezbyt precyzyjne, np. wiemy o przynależności kulturowej obiektu, ale w terminach wieku będzie to informacja rozmyta, sprowadzająca się do przedziału o szerokości np. setek lat, znacznie szerszego od rozkładu P(B|A), czyli od niepewności pomiarowej. W takiej sytuacji P(A) jest praktycznie stałe i we wzorze jakby tej wielkości nie było.

Jeżeli jednak, przed pomiarem mamy dość dokładne informacje o obiekcie (np. wynikające z innego, wcześniejszego pomiaru wieku) to sytuacja się komplikuje, przy czym z komplikacji tej wynikają ciekawe możliwości.

 

Prawdopodobieństwo subiektywne

Twierdzenie Bayesa pozwala, a nawet zobowiązuje, by w „legalny”, ścisły sposób wykorzystać wiedzę a priori. Ta wstępna wiedza o wieku obiektu może być subiektywna, nieformalna, może mieć źródło w intuicji badacza (Walanus 1983). Jednak może to też być wiedza pochodząca z innych pomiarów.

Jako prosty przykład rozpatrzyć można badanie autentyczności obiektu historycznego. Wątpliwości podlega, czy drewniana rzeźba istotnie jest średniowieczna, gdyż może być współczesnym falsyfikatem. Stosując radiowęgiel, musimy przy tym założyć iż falsyfikaty wykonuje się z drewna współczesnego, a na pewno młodszego od 1600 AD (patrz krzywa kalibracyjna). Być może wstępnie oceniamy, że obiekt, z prawdopodobieństwem 75% jest autentyczny, a w 25% jest falsyfikatem. Jeżeli kalibrowany wynik pomiaru wieku jednoznacznie wskaże na średniowiecze albo na współczesność (wiek radiowęglowy będzie zdecydowanie większy albo zdecydowanie mniejszy od 500 BP), to nasze prawdopodobieństwa a priori nie będą miały większego znaczenia, problem będzie rozstrzygnięty. Jednak w przypadku pośredniego wyniku pomiaru wieku, o dużej niepewności pomiarowej, mamy prawo uwzględnić wstępne oceny. Pomiar wieku, może np. zmodyfikować je tak, że prawdopodobieństwo autentyczności wzrośnie do np. 90%, ale może też osłabić jego pewność do poziomu np. 50%.

Wnioskowanie bayesowskie pozwoli jednak w jasny, przejrzysty sposób włączyć do badania subiektywne opinie a priori i połączyć je z obiektywnym wynikiem pomiaru. Metoda Bayesa wymaga oczywiście ilościowego ujęcia subiektywnych ocen, w procentach prawdopodobieństwa. Choć jest to osobnym tematem statystycznym (DeGroot 1981) to nie wydaje się by wielkim problemem miało być przypisanie liczby opinii typu: raczej A1 niż A2 (np. P(A1)=0,75, czyli P(A2)=0,25). Tym bardziej, że często wystarcza wykluczenie niektórych możliwości. Choć im bardziej radykalne opinie ferujemy (ze 100% pewnością), tym większą bierzemy za nie odpowiedzialność.

W rozdziale Uwzględnianie dodatkowej informacji znajdują się przykłady uwzględnienia niezależnej wiedzy w analizie wyników pomiarów wieku. Chodzi tu o stosunkowo niezawodne dane stratygraficzne, mówiące o kolejności warstw kulturowych, a sprowadzające się np. do wiedzy, że obiekt A1 jest starszy od obiektu A2, podczas gdy wyniki pomiaru metodą 14C nie są tak jednoznaczne.

Program OxCal umożliwia użycie w obliczeniach własnego rozkładu prawdopodobieństwa a priori (opcja Prior).

 

Plateau krzywej kalibracyjnej

Atomy 14C występują w atmosferze tylko dzięki temu, że są w niej stale produkowane. Szybkość ich produkcji nie jest jednak zupełnie stabilna. Absolutnie stabilne jest tylko tempo znikania 14C, poprzez rozpad promieniotwórczy, gdyż niezmienny jest okres połowicznego zaniku. Produkcja radiowęgla zależy od intensywności strumienia promieniowania kosmicznego. Wielkość ta podlega tzw. modulacji międzyplanetarnej, której główną przyczyną jest Słońce, za pośrednictwem swego pola magnetycznego. Szybkość produkcji 14C zależy też od pola magnetycznego Ziemi, które osłania Ziemię przed strumieniem naładowanych elektrycznie protonów.

W grę wchodzą także zmiany w obiegu węgla w przyrodzie. W młodszym dryasie, ostatnim, chłodnym okresie ostatniego zlodowacenia nastąpił wyraźny wzrost stężenia 14C w atmosferze (Goslar 1996) spowodowany być może zmianą cyrkulacji wód północnego Atlantyku. Później wystąpił spadek ilości 14C w atmosferze, tak jak gdyby w pewnym momencie zatrzymany został proces powstawania nowych atomów 14C. Wyobraźmy sobie odłamaną w tym czasie gałąź. Stężenie 14C w tym obiekcie, po odcięciu go od dostawy świeżego węgla, maleje zgodnie z prawem rozpadu (co powinno umożliwić kiedyś geomorfologowi stosującemu metodę 14C stwierdzenie, kiedy ten fakt miał miejsce). Wyobraźmy sobie jednak, że przez pewien czas, powiedzmy przez pięćset lat produkcja 14C była tak osłabiona, że 14C w atmosferze ubywało tak samo szybko jak w martwej gałęzi. Gdyby na końcu owego pięćsetletniego okresu odłamano inną gałąź, to byłoby w niej tyle samo 14C, co w gałęzi, która od pięciuset już lat leżała przykryta narastającą warstwą osadu. Tych dwóch gałęzi nie da się w przyszłości odróżnić w laboratorium radiowęglowym. Wynik pomiaru ich wieku będzie taki sam. Jest to poważne ograniczenie metody 14C, dotyczące pewnych okresów, a wynikające z nieuniknionej złożoności przyrody.

Datowanie Radiowęglowe

Mechanizm powstawania plateau, w okresie ok. 8700 BP. Nieregularna linia ciągła ilustruje zmiany stężenia 14C w atmosferze (obliczone na podstawie krzywej kalibracyjnej). Linia kropkowana wskazuje jak zmniejszało się stężenie 14C w szczątku organicznym, który zaprzestał pobierania węgla z atmosfery w roku 8875 BP. Linia ta ilustruje naturalny rozpad 14C. Na skutek spadku stężenia 14C w atmosferze, gałąź odłamana w roku 8550 BP będzie miała tyle samo 14C co gałąź z 8875.

Opisana wyżej, modelowa sytuacja jest nadmiernie uproszczona, rzeczywista sytuacja pokazana jest na powyższym rysunku. Widać tu nieregularne wahania stężenia 14C w atmosferze, które powodują, że obiekty pochodzące z różnych okresów czasu będą miały takie samo stężenie 14C i w rezultacie dadzą ten sam wynik pomiaru wieku. Jak widać na powyższym rysunku, spadek stężenia 14C w atmosferze może być nawet szybszy niż naturalny rozpad jąder 14C. Widoczne jest to, na przykład na odcinku czasu od 8875 BP do 8800 BP. Sytuacja taka dowodzi, że mechanizmem odpowiedzialnym za ubywanie 14C w atmosferze jest nie tylko zmniejszenie (ani nawet zaprzestanie) produkcji, lecz również mechanizm wymiany węgla ze środowiskami, w których stężenie 14C jest znacznie niższe niż w atmosferze (np. z oceanem).

Na rysunku wyżej przedstawiona jest rzeczywista, ale w pewnym sensie idealna sytuacja, gdy różnowiekowe obiekty mogą mieć w sobie dokładnie tyle samo 14C i mogłyby dać dokładnie ten sam wynik pomiaru wieku. Warto zwrócić uwagę, ze również obiekt z roku 8735 BC da potencjalnie taki sam wynik pomiaru. Obiekt z roku 8800 BC będzie miał mniej 14C, więc da wiek 14C starszy niż obiekt z 8875 BC, itd.

Przedstawione jest tu stężenie 14C w atmosferze, obliczone na podstawie krzywej kalibracyjnej. Nieregularna krzywa na powyższym rysunku, mimo pewnego podobieństwa nie jest krzywą kalibracyjną. Warto zauważyć, że gdyby stężenie 14C było w przeszłości stałe, odpowiadająca mu krzywa kalibracyjna byłaby przekątną na odpowiednim wykresie zależności wieku 14C od wieku kalendarzowego.

Odcinki poziome krzywej kalibracyjnej noszą nazwę plateau. Poziomy fragment krzywej kalibracyjnej, np. od 750 BC do 420 BC, jak na rysunku niżej, powoduje, że wszelkie obiekty pochodzące z tego okresu dadzą w wyniku pomiaru ten sam, jeden wiek 14C. W tym konkretnym wypadku będzie to ok. 2450 BP. Oczywiście pamiętać trzeba o niepewności pomiarowej, która może spowodować, że dla obiektu z przedziału 750 - 420 BC otrzymamy np. 2400±50 BP. Otrzymanie z laboratorium wyniku, nawet o małej niepewności; 2450±30 BP, nie pozwoli nam powiedzieć o obiekcie nic ponad to, że pochodzi z okresu 750 - 420 BC. Doszukiwanie się w rozkładzie prawdopodobieństwa minimów przy 680 BC albo 600 BC jest uzasadnione tylko w przypadku absolutnej pewności, co do wartości niepewności pomiarowej (±30 lat), jak i co do braku jakichkolwiek zanieczyszczeń próbki i innych błędów. Pewność tego typu nie jest jednak cechą badań przyrodniczych.

Datowanie Radiowęglowe

Fragment krzywej kalibracyjnej (z zakresem niepewności) z widocznym plateau z okresu halsztackiego. Obiekty o wieku z okresu od 750 BC do 420 BC dają mniej więcej ten sam wiek 14C wynoszący ok. 2450 BP. Poza krzywą kalibracyjną, na rysunku widoczny jest wynik kalibracji pomiaru 2450±30 BP.

 

Datowanie Radiowęglowe

Plateau historyczne, utrudniające stwierdzenie czy obiekt jest współczesny, powiedzmy dwudziestowieczny, czy raczej starszy. Pamiątkowy mebel z połowy XX wieku, historyczna rama z przełomu wieków XVIII/XIX, jak i płótno obrazu z drugiej połowy XVII wieku, mają w sobie tyle samo 14C. Rozstrzygnąć sprawę można, ewentualnie tylko metodą wiggle matching (patrz niżej).

Plateau radiowęglowe („wypłaszczenia”, „flattenings”) pokazane na obu powyższych rysunkach nie są jedynymi. Właściwie każde załamanie (ang. wiggle, patrz niżej) krzywej kalibracyjnej jest małym plateau. Przeglądając krzywą kalibracyjną znaleźć można wiele mniej więcej poziomych odcinków, a więc właśnie plateau. I tak mamy płaski odcinek krzywej między 8200-8000 BC, który utrudnia życie badaczom starszych kultur mezolitycznych. Podobną rolę w późnym mezolicie spełnia odcinek 7000-6700 BC. Kultury lateńskiej dotyczy „dołek” krzywej kalibracyjnej osiągający dno w okolicy roku 350 BC.

Należy pamiętać, że nie ma żadnego związku przyczynowego między plateau, ogólnie kształtem krzywej kalibracyjnej, a rzeczywistymi wiekami badanych obiektów archeologicznych. Niestety, kształt krzywej kalibracyjnej może mieć wpływ na interpretacje wieku, należy więc dołożyć starań by wpływ ten minimalizować (Walanus 2009).

Zdolność rozdzielcza metody radiowęglowej

Kłopoty związane z kształtem krzywej kalibracyjnej można też ująć w terminach zdolności rozdzielczej.

Pojecie zdolności rozdzielczej znane jest dobrze użytkownikom mikroskopów. Ogólnie, chodzi o to jak bliskie (również w czasie) obiekty da się odróżnić. Czy dwie kreski widzimy jako dwie, czy jako jedną nieco grubszą, szereg kresek jako szereg kresek, czy szary pas? Przy pomiarach, rozdzielczość zależała będzie zwykle od pozycji na zakresie pomiarowym. Zbliżanie się do kresu możliwości pomiarowych oznacza pogarszanie się rozdzielczości. W przypadku 14C taki efekt występuje przy próbkach o wieku 30 - 50 tys. lat. Zdolność rozdzielcza spada tam do zera i wynik ma postać „jednostronną”, np. >35.000 lat. Podobnie jest w pomiarach geochemicznych przy zbyt niskim stężeniu mierzonego składnika.

Definicja zdolność rozdzielczej metody pomiarowej jest specyficzna dla metody. W przypadku datowań radiowęglowych również trzeba zdecydować się na jakąś konkretną definicję. W tym momencie podkreślić trzeba, że chodziło będzie o wpływ krzywej kalibracyjnej na wynik określenia wieku, abstrahujemy więc od niepewności pomiaru stężenia 14C (odchylenia standardowe σ w dacie radiowęglowej). Niepewność pomiaru stężenia, jak to już było omawiane, zależy od typu i ilości dostępnego materiału. Dlatego w aspekcie krzywej kalibracyjnej, rozdzielczość metody rozpatrzona będzie dla trzech typowych wartości σ, a jak się okaże, zależność rozdzielczości od σ nie jest tak prosta jak można by się spodziewać, a bywa nawet odwrotna (im mniejsza niepewność, tym gorzej)!

Przed zdefiniowaniem zdolności rozdzielczej warto przypomnieć, że standardowym w naukach przyrodniczych, również w geologii, poziomem istotności jest liczba 0,05 (poziom ufności 1-0,05=0,95). Przypadek (?) chce, że odpowiada to niemal dokładnie zakresowi ±2σ w rozkładzie normalnym (Gaussa). Otóż w metodzie 14C, w czasach przed-kalibracyjnych (które gdzieniegdzie są jeszcze dniem dzisiejszym) wynik podawano zwyczajowo z niepewnością ±σ. Dlatego teraz, gdy odczytuje się z gęstości prawdopodobieństwa przedział ufności, istnieje tendencja by pozostać przy poziomie ufności 0,68, odpowiadającym ±1σ. Jednak taka praktyka, w momencie gdy wynik jest przedziałem (ufności), pozostaje w sprzeczności z ogólnym standardem. Przy tym nie chodzi tu wyłącznie o ideę normalizacji znaczeń, a również o zdroworozsądkowy sens. Jeżeli pisze się, że wiek próbki mieści się w przedziale 5450-5650, to sformułowanie to można zaakceptować, o ile prawdopodobieństwo, że istotnie tak jest bliskie 1 (np. gdy wynosi 0,95), ale nie, gdy wynosi ono tylko 2/3.

W zwykłych pomiarach, technicznych, fizycznych, chemicznych (i radiowęglowych przed kalibracją), dwie próbki różniące się o 2σ, mogą dać inwersję w wynikach pomiarów (taką, że próbka o mniejszej wartości mierzonego parametru da w wyniku liczbę większą niż druga próbka). Prawdopodobieństwo inwersji, w takim „normalnym” wypadku wynosi 0,08 (P(z>21/2s)=0,0787), czyli właściwą relację wyników otrzymuje się z prawdopodobieństwem 0,92. Zapytać można, jak owo prawdopodobieństwo braku inwersji będzie się kształtowało w przypadku datowania (oczywiście z kalibracją) dwóch próbek, których rzeczywiste wieki różnią się właśnie o 2σ.

Tak więc, dla dowolnego wieku T załóżmy, że rzeczywisty wiek pierwszej próbki wynosi T+σ, a drugiej T-σ. Na poniższym wykresie podane jest, w funkcji T, prawdopodobieństwo P tego, że daty 14C owych próbek, pozostaną we właściwej relacji starsza-młodsza. Gdyby nie krzywa kalibracyjna, wartość P byłaby stała i równa 0,92. Jak widać z wykresu, prawdopodobieństwo P braku inwersji jest z reguły najwyższe dla przypadku σ=100 lat, jednak wtedy chodzi o 200-letnią różnicę wieku próbek. Krzywa kalibracyjna jest wtedy, w jakimś sensie, poważnie wygładzana (rozkładem Gaussa). Przypadek σ=25 lat, czyli bardzo precyzyjny pomiarowo, doświadcza ze strony kalibracji brutalnej interwencji.

Datowanie Radiowęglowe

Rozdzielczość metody radiowęglowej w funkcji wieku rzeczywistego próbek zdefiniowana jako prawdopodobieństwo zachowania poprawnej kolejności dat 14C próbek, których wieki kalendarzowe różnią się o 2σ. Trzy krzywe odpowiadają trzem wartościom σ = 25, 50 i 100 lat. Wykres obejmuje zakres wieku kalendarzowego do 14 tys. lat BP.

Na przykład, w okolicy wieku 10200 BP krzywa kalibracyjna poprawia rozdzielczość metody, ale przy 11000 BP próbki o rzeczywistych wiekach różniących się o 50, 100, a nawet 200 lat mają jednakowe prawdopodobieństwo zachowania i nie zachowania właściwej kolejności w czasie. Ciekawa jest sytuacja, na przykład wokół wieku 2700 BP, para próbek nieco starszych zostaje „udoskonalona” – niemal na pewno nie będzie inwersji, jednak para próbek o wieku między 2650 i 2400 BP da inwersję wieku na zasadzie zupełnie losowej, jak przy rzucie monetą. Takie niekorzystne konsekwencje wynikają właśnie z istnienia plateau na krzywej kalibracyjnej.

Przedstawione na rysunku wyżej krzywe rozdzielczości metody radiowęglowej są innym spojrzeniem na kwestię wpływu krzywej kalibracyjnej na datowanie. Wydaje się, że jest to podejście bardziej bezpośrednie, bliższe temu, o co pyta użytkownik dat, zastanawiający się nad dokładnością metody w interesującym go przedziale czasowym.

Metoda „wiggle matching”

Metoda ta pozwala wyznaczyć wiek obiektów ze znacznie większą dokładnością, niż ma to miejsce w pojedynczych pomiarach 14C. Metoda ta ma zastosowanie, jeśli dysponujemy co najmniej dwoma obiektami (patrz schemat poniżej), których różnicę wieku znamy ze źródeł niezależnych, nie z wykonanych pomiarów 14C. Sytuacja taka zachodzi najczęściej, jeżeli próbkami są przyrosty roczne drzewa. Jesteśmy wtedy w stanie policzyć słoje między próbkami, a więc zmierzyć odstęp czasu między powstaniem obiektów, których wiek zmierzyliśmy metodą 14C. Metoda dendrochronologiczna pozwala skorelować nawet różne drzewa, tak, że próbki nie muszą pochodzić z jednego obiektu. Oczywiście lepiej jest dysponować większą liczbą próbek zbadanych dendrochronologicznie niż tylko dwiema.

Datowanie Radiowęglowe

Dane niezbędne do zastosowania metody wiggle matching.

Dysponując dodatkową informacją, na przykład w postaci znanej liczby słojów pomiędzy próbkami pobranymi do datowania spodziewać możemy się, że wiek obiektów wyznaczyć będzie można dokładniej, niż gdyby znane były tylko same wyniki pomiarów 14C. Jest to słuszne rozumowanie, jednak w istocie metoda wiggle matching idzie dalej. Wykorzystywany jest tu nieregularny kształt krzywej kalibracyjnej.

Gdyby nie było krzywej kalibracyjnej, lub gdyby była ona gładką linią, bez zębów czy załamań (ang. wiggle), to dodatkowa informacja o odległości między obiektami wnosiła by niewiele.

Dwa powiązane ze sobą wyniki pomiaru dałyby wiek zaledwie 1,4 razy dokładniejszy. Działoby się tak na zasadzie średniej arytmetycznej. Powiedzmy, że odstęp czasowy między próbkami jest najprostszy z możliwych; mianowicie wynosi 0 lat. W takiej sytuacji obliczamy po prostu średnią arytmetyczną z dwóch wartości wieku. Niepewność średniej jest mniejsza niż niepewności pomiarów składowych. Jeżeli obliczamy średnią arytmetyczną z dwóch wyników, które mają takie same lub przynajmniej podobne niepewności pomiarowe, wynoszące σ, to niepewność średniej wynosiła będzie σ/21/2. Niepewność średniej z czterech pomiarów byłaby dwa razy mniejsza, bo pierwiastek z 4 wynosi 2.

Ze względu na „zęby” krzywej kalibracyjnej, grupa dat (co najmniej dwie) musi spełnić dodatkowy wymóg „wpasowania” się w krzywą (rysunek niżej). Wynika z tego, co należy podkreślić, że niepewność danych o odstępie czasu między próbkami musi być mniejsza od szerokości „zębów”, z których chcemy skorzystać. Najlepiej by dokładność była sezonowa, taka, jaką daje dendrochronologia (o ile materiał próbek do pomiaru 14C pochodził z pojedynczych słojów). Jednak, dla starszych próbek, dla dat o większych niepewnościach (np. rzędu 100 lat), niedokładna informacja o odległości czasowej między obiektami (np. obarczona niepewnością 10-20 lat) może również być użyteczna.

Ważne jest natomiast by znany odstęp czasu między próbkami był jak największy, powinien w każdym razie wykraczać poza ewentualne plateau radiowęglowe. Takie sytuacje są w praktyce dość rzadkie. Liczenie słojów jednego kawałka drewna rzadko daje odstępy większe od 100 lat, wtedy różnice wieku 14C nie przekraczają 100 lat i trzeba mieć pomiary radiowęglowe o dużej precyzji by stosowanie wiggle matching miało sens. Jednak nawet, gdy dokładność pomiaru wynosi ±25 lat lub jest lepsza, wiggle matching niewiele daje, gdy grupa próbek nie wykracza poza plateau krzywej kalibracyjnej.

Datowanie Radiowęglowe

Dopasowanie pięciu wyników pomiaru (konwencjonalnych) do krzywej kalibracyjnej. Wyniki pomiaru przedstawione są, dla symetrii jako dwustronne krzywe Gaussa. Pięć wyników powiązanych jest ze sobą „sztywno”. Cała piątka może jednak być przesuwana w poziomie. Położenie zaznaczone szarymi figurami odpowiada najlepszemu dopasowaniu. Położenie zaznaczone białymi krzywymi nie daje tak dobrego dopasowania, szczególne pomiar drugi z lewej odstaje od krzywej kalibracyjnej.

Grupa wyników kilku pomiarów tworzy, jak gdyby, nową krzywą kalibracyjną, która oczywiście musi zgadzać się z oficjalną. Dlatego metodę wiggle matching nazywa się też metodą dopasowania krzywych.

Od strony matematycznej, dopasowanie krzywych sprawdza się tak, że testuje się wszystkie możliwe wzajemne położenia krzywych, obliczając za każdym razem statystykę χ2 (chi-kwadrat). Wielkość tą oblicza się następująco: obliczamy odległość w kierunku osi wieku radiowęglowego (w pionie) każdego pomiaru od krzywej kalibracyjnej, wyniki dzielimy przez niepewności pomiarowe (σ) i podnosimy do kwadratu, następnie sumujemy wyniki dla każdego pomiaru; otrzymana suma to χ2. Położenie, dla którego otrzymano najmniejsze χ2 wskazuje najbardziej prawdopodobny wiek. Tak otrzymany wynik oczywiście również ma swoją niepewność. Wartość χ2 dla sąsiednich dat będzie zwykle też dość mała, te daty również trzeba dopuścić jako możliwe, dopiero tam gdzie χ2 rośnie wyraźnie możemy powiedzieć, że osiągamy granice zakresu stanowiącego wynik pomiaru wieku. Zwykle jednak niepewność wieku wyznaczonego metodą wiggle matching jest znacznie mniejsza od niepewności pojedynczych pomiarów.

Do zagadnienia wiggle matching można też podejść inaczej. Na rysunku niżej przedstawione są rozkłady prawdopodobieństwa (po kalibracji) otrzymane z pomiarów wieku dwóch próbek. Z niezależnych danych (zapewne dendrochronologicznych) wiadomo, że obiekt 2 jest młodszy od obiektu 1 o 110 lat. Gdybyśmy wycięli (nożyczkami) wykres dla próbki 2 i przesunęli go w lewo o 110 lat, to dwa wykresy częściowo zaczęłyby się pokrywać. Ten pokrywający się fragment narysowany jest osobno, wyżej, gdyż jest on właśnie końcowym wynikiem wiggle matching.

Matematyczną podstawą takiej operacji jest zasada iloczynu prawdopodobieństw. Prawdopodobieństwo otrzymania orła na jednej monecie wynosi ½. Natomiast prawdopodobieństwo otrzymania dwóch orłów, na dwóch monetach wynosi ¼=½*½. Wiekiem próbki 1 nie może być np. 600 BC, jak dopuszczałby to jej rozkład, bo próbka 2 musiałaby mieć wtedy 600-110=490 BC, a tego z kolei jej rozkład nie dopuszcza. Prawdopodobieństwo P2(490 BC) wynosi 0, a mnożenie przez zero, jakiegokolwiek innego prawdopodobieństwa, zawsze da w wyniku zero.

Datowanie Radiowęglowe

Wynik analizy wiggle matching otrzymany za pomocą programu OxCal. Górny rozkład jest końcowym wynikiem, odnoszącym się do próbki 1 (ale wykorzystującym obie daty). Dla próbki 2 rozkład byłby identyczny, lecz przesunięty o 110 lat w prawo, gdyż taka jest, znana z dendrochronologii różnica wieku badanych obiektów. Pokazane są też zwykłe rozkłady, dla obu próbek.

Przybliżoną analizę metodą wiggle matching można przeprowadzić bez specjalizowanych programów komputerowych, a nawet bez programu do kalibracji, dysponować jednak trzeba krzywą kalibracyjną. Najpierw „wykalibrować” trzeba radiowęglowe wyniki pomiaru wieku (BP). W tym celu rysujemy poziome linie, np. dla wieku 350±45 linie umieszczamy na wysokości 395 BP, 350 BP i 305 BP (rysunek niżej), nie zaszkodziłyby też cieńsze linie „dwusigmowe” na 440 BP i 260 BP. Linie przeciąć muszą krzywą kalibracyjną. Następnie, na folii, korzystając ze skali poziomej wieku kalendarzowego (AD/BC) rysujemy serię pionowych linii, takich by odległości między nimi były takie jak znane nam różnice wieków kolejnych obiektów. Teraz nakładamy folię na kartkę z krzywą kalibracyjną i wynikami pomiarów w postaci poziomych linii i szukamy najlepszego dopasowania. Bardzo dobrze byłoby gdyby dla każdej próbki odpowiadająca jej linia pionowa przecięła krzywą kalibracyjną w zakresie wyznaczonym przez niepewność daty 14C tej próbki, czyli przez odpowiednie, poziome linie.

Datowanie Radiowęglowe

Ręczne wiggle matching dwóch pomiarów. Na powiększonym, za pomocą kserografu, fragmencie krzywej kalibracyjnej (tu jest) rysujemy poziome linie odpowiadające wiekowi 14C (BP). Natomiast na przeźroczystej folii rysujemy pionowe linie w odstępie takim jaki jest odstęp czasowy między obiektami. Folię nakładamy na rysunek i przesuwając ją w lewo i w prawo szukamy najlepszego dopasowania. Wiek kalendarzowy obu próbek odczytujemy na osi poziomej.

W analizie ręcznej, jak i w analizach w pełni skomputeryzowanych zwrócić trzeba uwagę na otrzymaną, wewnętrzną zgodność wyniku. Do analizy wiggle matching „wchodzą” zarówno wyniki pomiarów 14C, jak i niezależne od nich dane, otrzymane np. od dendrochronologa. Jak wszystkie dane przyrodnicze, tak i dane z obu tych grup mają ograniczony stopień pewności. Analiza wiggle matching, niejako przy okazji, weryfikuje wzajemną zgodność danych. Na powyższym rysunku rozkłady „zaczepiły się”, choć nie została już duża rezerwa. Gdybyśmy o tych obiektach mieli dane, że jeden jest starszy od drugiego nie o 110 lat a tylko o 50 lat, to otrzymalibyśmy w programie OxCal ostrzeżenie o słabej zgodności dat i o dużej wartości χ2. Wykonując analizę ręcznie niezgodność widzielibyśmy „jak na dłoni”, choć w tym przykładzie nie byłaby ona jeszcze rażąca.

Ograniczenia geograficzne krzywej kalibracyjnej

Obszar równikowy, jak się okazuje dość wyraźnie rozdziela atmosferę na dwie półkule. Wynika to z intensywnego wznoszenia mas powietrza nad równikiem. Wobec takiego efektu spodziewać się można różnic w stężeniu 14C pomiędzy północną i południową półkulą. I rzeczywiście, dla półkuli południowej jest nieco inna niż dla północnej, a dla obszarów okołorównikowych jej przebieg jest pośredni. Wiek radiowęglowy dla półkuli południowej jest starszy o ok. 30 lat (Hogg i inni 2002).

W związku z wymianą węgla pomiędzy atmosferą a oceanami obserwuje się też zjawisko modyfikowania stężenia 14C na zachodnich wybrzeżach kontynentów, w pobliżu obszarów tzw. upwellingu w oceanach, czyli wynoszenia głębokich wód na powierzchnię oceanu. Ten efekt również ma wpływ na przebieg lokalnej krzywej kalibracyjnej.

Należy podkreślić należy, że nawet wspomniane tu regionalne różnice nie są duże i, na przykład dla Europy zagadnienie to nie ma praktycznego znaczenia.

Trzeba jednak pamiętać, że dotyczy to tylko szczątków organizmów, które czerpały węgiel z atmosfery. Inaczej przedstawia się kalibracja wieku 14C szczątków organizmów morskich. Krzywa kalibracyjna jest tu znacznie wygładzona w stosunku do krzywej „atmosferycznej” i przesunięta w stronę większych wartości wieku 14C. Poważnym problemem jest to, że przesunięcie to jest różne w różnych regionach i wynosi od 200 do >1000 lat.


Koniec rozdziału: Kalibracja metody 14C     Następny rozdział     Spis treści