Konwertowanie zdjęć z geotagami na nakładki zdjęć w formacie KML

Mano Marks, zespół ds. interfejsów API Google Geo
Styczeń 2009 r.

Cel

Z tego samouczka dowiesz się, jak używać zdjęć z geotagami do tworzenia plików KMLPhotoOverlays. Przykładowy kod jest napisany w języku Python, ale istnieje wiele podobnych bibliotek w innych językach programowania, więc nie powinno być problemu z przetłumaczeniem tego kodu na inny język. Kod w tym artykule korzysta z biblioteki Pythona o otwartym kodzie źródłowym EXIF.py.

Wprowadzenie

Aparaty cyfrowe to niesamowite urządzenia. Wielu użytkowników nie zdaje sobie z tego sprawy, ale robią oni coś więcej niż tylko zdjęcia i filmy. Oznaczają też te filmy i zdjęcia metadanymi dotyczącymi kamery i jej ustawień. W ostatnich latach użytkownicy znaleźli sposoby na dodawanie do tych informacji danych geograficznych, które są osadzane przez producentów aparatów, np. w niektórych aparatach Ricoh i Nikon, lub za pomocą urządzeń takich jak rejestratory GPS i EyeFi Explore. Telefony z aparatem, takie jak iPhone i telefony z Androidem, np. G1 od T-Mobile, automatycznie osadzają te dane. Niektóre witryny do przesyłania zdjęć, takie jak Panoramio, Picasa Web AlbumsFlickr, automatycznie analizują dane GPS i używają ich do geotagowania zdjęć. Następnie możesz przywrócić te dane w plikach danych. Ale gdzie w tym zabawa? Z tego artykułu dowiesz się, jak samodzielnie uzyskać te dane.

Nagłówki EXIF

Najczęstszym sposobem osadzania danych w pliku obrazu jest użycie formatu EXIF. Dane są przechowywane w formie binarnej w nagłówkach EXIF w standardowy sposób. Jeśli znasz specyfikację nagłówków EXIF, możesz je samodzielnie przeanalizować. Na szczęście ktoś już wykonał tę ciężką pracę i napisał moduł Pythona. Biblioteka open source EXIF.py to świetne narzędzie do odczytywania nagłówków plików JPEG.

Kodeks

Przykładowy kod do tego artykułu znajduje się w tym pliku: exif2kml.py. Jeśli chcesz od razu zacząć z niego korzystać, pobierz ten moduł oraz plik EXIF.py i umieść je w tym samym katalogu. Uruchom python exif2kml.py foo.jpg, zastępując foo.jpg ścieżką do zdjęcia z geotagiem. Spowoduje to utworzenie pliku o nazwie test.kml.

Analizowanie nagłówków Exif

EXIF.py zapewnia prosty interfejs do wyodrębniania nagłówków Exif. Wystarczy uruchomić funkcję process_file(), a zwróci ona nagłówki jako obiekt dict.

def GetHeaders(the_file):
  """Handles getting the Exif headers and returns them as a dict.

  Args:
    the_file: A file object

  Returns:
    a dict mapping keys corresponding to the Exif headers of a file.
  """

  data = EXIF.process_file(the_file, 'UNDEF', False, False, False)
  return data

Po uzyskaniu nagłówków Exif musisz wyodrębnić współrzędne GPS. EXIF.py traktuje je jako obiekty Ratio, czyli obiekty do przechowywania licznika i mianownika wartości. Ustawia to dokładny stosunek, zamiast polegać na liczbie zmiennoprzecinkowej. KML wymaga jednak liczb dziesiętnych, a nie stosunków. Wyodrębnij więc każdą ze współrzędnych i przekonwertuj licznik i mianownik na jedną liczbę zmiennoprzecinkową, aby uzyskać stopnie dziesiętne:

def DmsToDecimal(degree_num, degree_den, minute_num, minute_den,
                 second_num, second_den):
  """Converts the Degree/Minute/Second formatted GPS data to decimal degrees.

  Args:
    degree_num: The numerator of the degree object.
    degree_den: The denominator of the degree object.
    minute_num: The numerator of the minute object.
    minute_den: The denominator of the minute object.
    second_num: The numerator of the second object.
    second_den: The denominator of the second object.

  Returns:
    A deciminal degree.
  """

  degree = float(degree_num)/float(degree_den)
  minute = float(minute_num)/float(minute_den)/60
  second = float(second_num)/float(second_den)/3600
  return degree + minute + second


def GetGps(data):
  """Parses out the GPS coordinates from the file.

  Args:
    data: A dict object representing the Exif headers of the photo.

  Returns:
    A tuple representing the latitude, longitude, and altitude of the photo.
  """

  lat_dms = data['GPS GPSLatitude'].values
  long_dms = data['GPS GPSLongitude'].values
  latitude = DmsToDecimal(lat_dms[0].num, lat_dms[0].den,
                          lat_dms[1].num, lat_dms[1].den,
                          lat_dms[2].num, lat_dms[2].den)
  longitude = DmsToDecimal(long_dms[0].num, long_dms[0].den,
                           long_dms[1].num, long_dms[1].den,
                           long_dms[2].num, long_dms[2].den)
  if data['GPS GPSLatitudeRef'].printable == 'S': latitude *= -1
  if data['GPS GPSLongitudeRef'].printable == 'W': longitude *= -1
  altitude = None

  try:
    alt = data['GPS GPSAltitude'].values[0]
    altitude = alt.num/alt.den
    if data['GPS GPSAltitudeRef'] == 1: altitude *= -1

  except KeyError:
    altitude = 0

  return latitude, longitude, altitude

Po uzyskaniu współrzędnych możesz łatwo utworzyć prosty PhotoOverlay dla każdego zdjęcia:

def CreatePhotoOverlay(kml_doc, file_name, the_file, file_iterator):
  """Creates a PhotoOverlay element in the kml_doc element.

  Args:
    kml_doc: An XML document object.
    file_name: The name of the file.
    the_file: The file object.
    file_iterator: The file iterator, used to create the id.

  Returns:
    An XML element representing the PhotoOverlay.
  """

  photo_id = 'photo%s' % file_iterator
  data = GetHeaders(the_file)
  coords = GetGps(data)

  po = kml_doc.createElement('PhotoOverlay')
  po.setAttribute('id', photo_id)
  name = kml_doc.createElement('name')
  name.appendChild(kml_doc.createTextNode(file_name))
  description = kml_doc.createElement('description')
  description.appendChild(kml_doc.createCDATASection('<a href="#%s">'
                                                     'Click here to fly into '
                                                     'photo</a>' % photo_id))
  po.appendChild(name)
  po.appendChild(description)

  icon = kml_doc.createElement('icon')
  href = kml_doc.createElement('href')
  href.appendChild(kml_doc.createTextNode(file_name))

  camera = kml_doc.createElement('Camera')
  longitude = kml_doc.createElement('longitude')
  latitude = kml_doc.createElement('latitude')
  altitude = kml_doc.createElement('altitude')
  tilt = kml_doc.createElement('tilt')

  # Determines the proportions of the image and uses them to set FOV.
  width = float(data['EXIF ExifImageWidth'].printable)
  length = float(data['EXIF ExifImageLength'].printable)
  lf = str(width/length * -20.0)
  rf = str(width/length * 20.0)

  longitude.appendChild(kml_doc.createTextNode(str(coords[1])))
  latitude.appendChild(kml_doc.createTextNode(str(coords[0])))
  altitude.appendChild(kml_doc.createTextNode('10'))
  tilt.appendChild(kml_doc.createTextNode('90'))
  camera.appendChild(longitude)
  camera.appendChild(latitude)
  camera.appendChild(altitude)
  camera.appendChild(tilt)

  icon.appendChild(href)

  viewvolume = kml_doc.createElement('ViewVolume')
  leftfov = kml_doc.createElement('leftFov')
  rightfov = kml_doc.createElement('rightFov')
  bottomfov = kml_doc.createElement('bottomFov')
  topfov = kml_doc.createElement('topFov')
  near = kml_doc.createElement('near')
  leftfov.appendChild(kml_doc.createTextNode(lf))
  rightfov.appendChild(kml_doc.createTextNode(rf))
  bottomfov.appendChild(kml_doc.createTextNode('-20'))
  topfov.appendChild(kml_doc.createTextNode('20'))
  near.appendChild(kml_doc.createTextNode('10'))
  viewvolume.appendChild(leftfov)
  viewvolume.appendChild(rightfov)
  viewvolume.appendChild(bottomfov)
  viewvolume.appendChild(topfov)
  viewvolume.appendChild(near)

  po.appendChild(camera)
  po.appendChild(icon)
  po.appendChild(viewvolume)
  point = kml_doc.createElement('point')
  coordinates = kml_doc.createElement('coordinates')
  coordinates.appendChild(kml_doc.createTextNode('%s,%s,%s' %(coords[1],
                                                              coords[0],
                                                              coords[2])))
  point.appendChild(coordinates)

  po.appendChild(point)

  document = kml_doc.getElementsByTagName('Document')[0]
  document.appendChild(po)

Jak widzisz, używamy tylko standardowych metod W3C DOM, ponieważ są one dostępne w większości języków programowania. Aby zobaczyć, jak to wszystko działa, pobierz kod tutaj.

Ten przykład nie wykorzystuje w pełni możliwości PhotoOverlays, które pozwalają na szczegółowe eksplorowanie zdjęć w wysokiej rozdzielczości. Pokazuje jednak, jak zawiesić zdjęcie w stylu billboardu nad Google Earth. Oto przykładowy plik KML utworzony za pomocą tego kodu:

<?xml version="1.0" encoding="utf-8"?>
<kml xmlns="http://www.opengis.net/kml/2.2">
  <Document>
    <PhotoOverlay id="photo0">
      <name>
        1228258523134.jpg
      </name>
      <description>
<![CDATA[<a href="#photo0">Click here to fly into photo</a>]]>      </description>
      <Camera>
      	<longitude>
          -122.3902159196034
        </longitude>
        <latitude>
           37.78961266330473
        </latitude>
        <altitude>
          10
        </altitude>
        <tilt>
          90
        </tilt>
      </Camera>
      <Icon>
        <href>
          1228258523134.jpg
        </href>
      </Icon>
      <ViewVolume>
        <leftFov>
          -26.6666666667
        </leftFov>
        <rightFov>
          26.6666666667
        </rightFov>
        <bottomFov>
          -20
        </bottomFov>
        <topFov>
          20
        </topFov>
        <near>
          10
        </near>
      </ViewVolume>
      <Point>
        <coordinates>
          -122.3902159196034,37.78961266330473,0
        </coordinates>
      </Point>
    </PhotoOverlay>
  </Document>
</kml>

A tak wygląda to w Google Earth:


Ostrzeżenia

Geotagowanie zdjęć jest wciąż w powijakach.

Oto kilka kwestii, o których warto pamiętać:

  • Urządzenia GPS nie zawsze są w 100% dokładne, zwłaszcza te w aparatach, dlatego warto sprawdzić lokalizację zdjęć.
  • Wiele urządzeń nie śledzi wysokości, tylko ustawia ją na 0. Jeśli wysokość jest dla Ciebie ważna, musisz znaleźć inny sposób na zbieranie tych danych.
  • Pozycja GPS to pozycja aparatu, a nie obiektu na zdjęciu. Dlatego w tym przykładzie element Camera jest umieszczony w pozycji GPS, a rzeczywiste zdjęcie jest od niej oddalone.
  • Dane EXIF nie zawierają informacji o kierunku, w którym jest skierowany aparat, więc może być konieczne dostosowanie PhotoOverlays. Dobra wiadomość jest taka, że niektóre urządzenia, np. telefony z systemem operacyjnym Android, umożliwiają bezpośrednie rejestrowanie danych, takich jak kierunek kompasu i nachylenie, ale nie w nagłówkach Exif.

Mimo to jest to skuteczny sposób na wizualizację zdjęć. Mamy nadzieję, że w przyszłości będziemy widzieć coraz więcej zdjęć z dokładniejszymi geotagami.

Co dalej

Po rozpoczęciu korzystania z nagłówków EXIF możesz zapoznać się ze specyfikacją EXIF. Zawiera ona wiele innych danych, które możesz przechwytywać i umieszczać w dymku z opisem. Możesz też tworzyć bardziej rozbudowane PhotoOverlays za pomocą ImagePyramids. W artykule w Przewodniku dla deweloperów na stronie PhotoOverlays znajdziesz dobry przegląd ich zastosowań.