
Studienarbeiten
2011
Dominicus, Tim Florian:
Vergleich von Verfahren zur Rekonstruktion von Oberflächen
Bachelorarbeit, Bonn 2011
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Inf. Jan Siegemund [ Zusammenfassung ]
Zusammenfassung
Vergleich von Verfahren zur Rekonstruktion von Oberflächen
Der Bedarf an digitalen 3D-Modellen in verschiedenen Disziplinen nimmt stetig zu. Grundlage dafür sind oft Dichte Punktwolken. Diese Punktwolken können mit Hilfe verschiedener Verfahren erstellt werden. Eine Möglichkeit ist das Stereomatching. Dabei gibt es verschiedene Ansätze. In dieser Arbeit untersuchen wir drei verschiedene Stereomatching Algorithmen und vergleichen deren Eigenschaften in Bezug auf Genauigkeit, Punktdichte und Punktverteilung. Die verwendeten Verfahren sind die Multi-view stereo Software, das Semi-global Matching und das 3-Bild Semi-global matching. Um diese Verfahren zu untersuchen haben wir zwei Experimente durchgeführt. Wir verwenden jede dieser Methoden um eine dichte Punktwolke aus mehreren Bildern einer Szene zu erstellen. Diese Punktwolken vergleichen wir dann mit einer Referenzpunktwolke. Im ersten Experiment ist diese Referenz vorgegeben. Im zweiten Experiment erstellen wir diese Referenz, in dem wir die Szene mit einem Lasertriangulationsscanner erfassen . Wir hatten erwartet, dass die beiden SGM Algorithmen in allen drei Eigenschaften dem PMVS überlegen ist. Unsere Experimente zeigen jedoch, dass dies nur unter bestimmten Bedingungen der Fall ist. Während die Punktdichte im ersten Experiment beim SGM deutlich höher und die Punktverteilung besser ist, ist die Genauigkeit etwas geringer als die des PMVS. Beide SGM Verfahren bringen im zweiten Experiment noch schlechtere Ergebnisse. Die Punktdichte in den Punktwolken des SGM ist geringer und die Punktverteilung leicht besser. Die Genauigkeit des SGM ist leicht schlechter als die des PMVS. The 3-Image SGM only produced only a very sparse point cloud with a high number of outliers. We could not calculate an accuracy rating for this method. However, we assume that these findings are due to poor camera orientation in the second experiment. Das 3-Bild SGM berechnet hier nur eine sehr dünne Punktwolke mit einer hohen Zahl an Ausreißern. Wir konnten keine Punktwolke erstellen, bei der die Berechnung der Genauigkeit sinnvoll gewesen wäre. Wir vermuten jedoch, dass dies nicht am Algorithmus, sondern an einer schlechten Orientierung der Kameras im zweiten Experiment liegt.
Abstract
Comparison of Methods for the reconstruction of Surfaces
There is a growing demand for digital 3D-models in various disciplines. Dense point clouds are often the basis for these. These point clouds can be generated by a variety of different methods. One possible method is Stereo matching. There are different approaches to this. In this thesis, we examine three different Stereo matching Algorithms and compare their qualities with respect to accuracy, point density and point distribution. The used Algorithms are the Patch-based Multi-view stereo Software, the Semi-global Matching and the 3-Image Semi-global matching. In order to test these methods, we conduct two experiments. Each method is used to create dense point cloud, which we then compare to a reference cloud. The reference clouds are predetermined in the first Experiment and gathered with a Laser triangulation scanner in the second. The resulting point cloud is then analyzed. We predicted, that both SGM Algorithms perform better than the PMVS all examined characteristics. However, our experiments show that this is only true under certain conditions. While the point density and distribution is considerably higher in the first experiment, the accuracy is slightly lower compared to the PMVS. Both SGM methods show even worse results in the second experiment. Here, the density of the results of the SGM is lower and the distribution is slightly better. The accuracy of the SGM is on the same level as the PMVS. The 3-Image SGM only produced only a very sparse point cloud with a high number of outliers. We could not calculate an accuracy rating for this method. However, we assume that these findings are due to poor camera orientation in the second experiment.
Vergleich von Verfahren zur Rekonstruktion von Oberflächen
Der Bedarf an digitalen 3D-Modellen in verschiedenen Disziplinen nimmt stetig zu. Grundlage dafür sind oft Dichte Punktwolken. Diese Punktwolken können mit Hilfe verschiedener Verfahren erstellt werden. Eine Möglichkeit ist das Stereomatching. Dabei gibt es verschiedene Ansätze. In dieser Arbeit untersuchen wir drei verschiedene Stereomatching Algorithmen und vergleichen deren Eigenschaften in Bezug auf Genauigkeit, Punktdichte und Punktverteilung. Die verwendeten Verfahren sind die Multi-view stereo Software, das Semi-global Matching und das 3-Bild Semi-global matching. Um diese Verfahren zu untersuchen haben wir zwei Experimente durchgeführt. Wir verwenden jede dieser Methoden um eine dichte Punktwolke aus mehreren Bildern einer Szene zu erstellen. Diese Punktwolken vergleichen wir dann mit einer Referenzpunktwolke. Im ersten Experiment ist diese Referenz vorgegeben. Im zweiten Experiment erstellen wir diese Referenz, in dem wir die Szene mit einem Lasertriangulationsscanner erfassen . Wir hatten erwartet, dass die beiden SGM Algorithmen in allen drei Eigenschaften dem PMVS überlegen ist. Unsere Experimente zeigen jedoch, dass dies nur unter bestimmten Bedingungen der Fall ist. Während die Punktdichte im ersten Experiment beim SGM deutlich höher und die Punktverteilung besser ist, ist die Genauigkeit etwas geringer als die des PMVS. Beide SGM Verfahren bringen im zweiten Experiment noch schlechtere Ergebnisse. Die Punktdichte in den Punktwolken des SGM ist geringer und die Punktverteilung leicht besser. Die Genauigkeit des SGM ist leicht schlechter als die des PMVS. The 3-Image SGM only produced only a very sparse point cloud with a high number of outliers. We could not calculate an accuracy rating for this method. However, we assume that these findings are due to poor camera orientation in the second experiment. Das 3-Bild SGM berechnet hier nur eine sehr dünne Punktwolke mit einer hohen Zahl an Ausreißern. Wir konnten keine Punktwolke erstellen, bei der die Berechnung der Genauigkeit sinnvoll gewesen wäre. Wir vermuten jedoch, dass dies nicht am Algorithmus, sondern an einer schlechten Orientierung der Kameras im zweiten Experiment liegt.
Abstract
Comparison of Methods for the reconstruction of Surfaces
There is a growing demand for digital 3D-models in various disciplines. Dense point clouds are often the basis for these. These point clouds can be generated by a variety of different methods. One possible method is Stereo matching. There are different approaches to this. In this thesis, we examine three different Stereo matching Algorithms and compare their qualities with respect to accuracy, point density and point distribution. The used Algorithms are the Patch-based Multi-view stereo Software, the Semi-global Matching and the 3-Image Semi-global matching. In order to test these methods, we conduct two experiments. Each method is used to create dense point cloud, which we then compare to a reference cloud. The reference clouds are predetermined in the first Experiment and gathered with a Laser triangulation scanner in the second. The resulting point cloud is then analyzed. We predicted, that both SGM Algorithms perform better than the PMVS all examined characteristics. However, our experiments show that this is only true under certain conditions. While the point density and distribution is considerably higher in the first experiment, the accuracy is slightly lower compared to the PMVS. Both SGM methods show even worse results in the second experiment. Here, the density of the results of the SGM is lower and the distribution is slightly better. The accuracy of the SGM is on the same level as the PMVS. The 3-Image SGM only produced only a very sparse point cloud with a high number of outliers. We could not calculate an accuracy rating for this method. However, we assume that these findings are due to poor camera orientation in the second experiment.
[ BibTex ]
@MASTERSTHESIS{dominicus11:vergleich,
title={Vergleich von Verfahren zur Rekonstruktion von Oberflächen},
year={2011},
school={Institute of Photogrammetry, University of Bonn},
type={bachelor thesis}
}
Korschek, Matthias:
Oberflächenrekonstruktion aus orientierten Punktwolken
Bachelorarbeit, Bonn 2011
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. Falko Schindler [ Zusammenfassung ]
Zusammenfassung
Objekte können im Computer durch 3D-Modelle dargestellt werden. Die Erfassung des Objektes erfolgt durch verschiedene Laserscanningverfahren oder durch Multi-View-Stereo- Verfahren, und resultiert in einer Punktwolke. Punktwolken beinhalten mindestens die 3D-Koordinaten der Punkte. Zusätzliche Informationen können Farbinformationen und Punktnormalen sein. Es gibt zahlreiche Algorithmen um aus den Informationen der Punktwolke eine Oberfläche des Objektes zu rekonstruieren. Die Schwierigkeit besteht darin, die Topologie der realen Oberfläche des Objektes, in der Rekonstruktion zu bewahren. Die Aufgabe dieser Arbeit besteht darin, zu untersuchen, inwieweit Rekonstruktionsverfahren mit und ohne Berücksichtigung der Punktnormalen zu topologischen Verletzungen führen. Es kommen drei Algorithmen zum Einsatz. Der Ball-Pivoting Algorithmus errechnet sich die Punktnormalen aus der Punktwolke. Der Robust Crust Algorithmus nutzt keine Punktnormalen zur Rekonstruktion, und die Poisson Oberflächenrekonstruktion benötigt die Punktnormalen vorab. Die Algorithmen werden mit zehn Datensätzen angewendet, die auf selbst formulierte Fragestellungen abzielen. Die quantitative Bewertung wird anhand der Anzahl der topologischen Verletzungen des eigens aufgestellten topologischen Modells festgemacht. Die qualitative Bewertung erfolgt visuell und analytisch. Die Ergebnisse der Untersuchungen zeigen, dass Algorithmen, die Punktnormalen berücksichtigen, weniger topologische Verletzungen hervorrufen. Gegebenenfalls ist die Berechnung der Punktnormalen auf die Eigenschaften der Punktwolke abzustimmen, um einer Berechnung mit falschen Punkten vorzubeugen. Außerdem wurde festgestellt, dass die Aufnahmeart von Punktwolken, deren Qualität und die Wahl der Algorithmen, Einfluss auf die topologische Konsistenz haben. Zusätzlich wurde herausgefunden, dass eine topologisch korrekte Rekonstruktion, der realen Oberfläche nicht zwangsläufig am ähnlichsten ist.
Abstract
Surface reconstruction from oriented point clouds
Objects can be represented by realistic 3D-computer models. One can obtain the models by using a variety of scanning devices, or by using multi-view stereo software, to get point cloud data. A point cloud contains at least the coordinates of 3D-points. Additional contents can be colour informations and vertex normals for each point. There are several surface reconstruction algorithms, to construct a surface given the informations of the point cloud data. The difficulty is to maintain the topology of the original surface. The task of this paper is to determine whether surface reconstruction algorithms with or without regard to vertex normals lead to topological inconsistency. The researches are based on three algorithms. The Ball-Pivoting algorithm calculates the needed vertex normals in advance. For the Robust Crust algorithm vertex normals are redundant to construct a surface. And the Poisson surface reconstruction requires vertex normals given from the point cloud data. The algorithms are used on ten different point set samples, which are in pursuit of self-defined tasks. The quantitative evaluation method is based on the number of topological violations of the selfdefined topological model. The qualitative evaluation method will be performed visually and analytically. The results of the analyses show that surface reconstruction algorithms with regard to vertex normals lead to lesser topological violations. If the circumstances require the calculation of vertex normals, the calculation has to be adjusted to the characteristics of the given point cloud to avoid a calculation with wrong vertices. Furthermore it became apparent that the way of measurement, the quality of point set samples, and the choice of the algorithm influence the topological consistency as well. Additionally it was found that a topologically consistent surface reconstruction does not necessarily mean that the reconstruction resembles the original surface the most.
Objekte können im Computer durch 3D-Modelle dargestellt werden. Die Erfassung des Objektes erfolgt durch verschiedene Laserscanningverfahren oder durch Multi-View-Stereo- Verfahren, und resultiert in einer Punktwolke. Punktwolken beinhalten mindestens die 3D-Koordinaten der Punkte. Zusätzliche Informationen können Farbinformationen und Punktnormalen sein. Es gibt zahlreiche Algorithmen um aus den Informationen der Punktwolke eine Oberfläche des Objektes zu rekonstruieren. Die Schwierigkeit besteht darin, die Topologie der realen Oberfläche des Objektes, in der Rekonstruktion zu bewahren. Die Aufgabe dieser Arbeit besteht darin, zu untersuchen, inwieweit Rekonstruktionsverfahren mit und ohne Berücksichtigung der Punktnormalen zu topologischen Verletzungen führen. Es kommen drei Algorithmen zum Einsatz. Der Ball-Pivoting Algorithmus errechnet sich die Punktnormalen aus der Punktwolke. Der Robust Crust Algorithmus nutzt keine Punktnormalen zur Rekonstruktion, und die Poisson Oberflächenrekonstruktion benötigt die Punktnormalen vorab. Die Algorithmen werden mit zehn Datensätzen angewendet, die auf selbst formulierte Fragestellungen abzielen. Die quantitative Bewertung wird anhand der Anzahl der topologischen Verletzungen des eigens aufgestellten topologischen Modells festgemacht. Die qualitative Bewertung erfolgt visuell und analytisch. Die Ergebnisse der Untersuchungen zeigen, dass Algorithmen, die Punktnormalen berücksichtigen, weniger topologische Verletzungen hervorrufen. Gegebenenfalls ist die Berechnung der Punktnormalen auf die Eigenschaften der Punktwolke abzustimmen, um einer Berechnung mit falschen Punkten vorzubeugen. Außerdem wurde festgestellt, dass die Aufnahmeart von Punktwolken, deren Qualität und die Wahl der Algorithmen, Einfluss auf die topologische Konsistenz haben. Zusätzlich wurde herausgefunden, dass eine topologisch korrekte Rekonstruktion, der realen Oberfläche nicht zwangsläufig am ähnlichsten ist.
Abstract
Surface reconstruction from oriented point clouds
Objects can be represented by realistic 3D-computer models. One can obtain the models by using a variety of scanning devices, or by using multi-view stereo software, to get point cloud data. A point cloud contains at least the coordinates of 3D-points. Additional contents can be colour informations and vertex normals for each point. There are several surface reconstruction algorithms, to construct a surface given the informations of the point cloud data. The difficulty is to maintain the topology of the original surface. The task of this paper is to determine whether surface reconstruction algorithms with or without regard to vertex normals lead to topological inconsistency. The researches are based on three algorithms. The Ball-Pivoting algorithm calculates the needed vertex normals in advance. For the Robust Crust algorithm vertex normals are redundant to construct a surface. And the Poisson surface reconstruction requires vertex normals given from the point cloud data. The algorithms are used on ten different point set samples, which are in pursuit of self-defined tasks. The quantitative evaluation method is based on the number of topological violations of the selfdefined topological model. The qualitative evaluation method will be performed visually and analytically. The results of the analyses show that surface reconstruction algorithms with regard to vertex normals lead to lesser topological violations. If the circumstances require the calculation of vertex normals, the calculation has to be adjusted to the characteristics of the given point cloud to avoid a calculation with wrong vertices. Furthermore it became apparent that the way of measurement, the quality of point set samples, and the choice of the algorithm influence the topological consistency as well. Additionally it was found that a topologically consistent surface reconstruction does not necessarily mean that the reconstruction resembles the original surface the most.
[ BibTex ]
@MASTERSTHESIS{korschek11:oberfl\"{a}chenrekonstruktion,
author={Korschek, Matthias},
title={Oberfl\"{a}chenrekonstruktion aus orientierten Punktwolken},
school={Institute of Photogrammetry, University of Bonn},
year={2011},
type={bachelor thesis},
}
Olinger, Marc:
Identifikation von Kammmolchen
Bachelorarbeit, Bonn 2011
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. Ribana Roscher [ Zusammenfassung ]
Zusammenfassung
Identifikation von Kammmolchen
Ziel dieser Arbeit ist es die Identifikation von Kammmolchen zu automatisieren. Gegeben sind zwei Gruppen mit jeweils 34 Kammmolchbildern. Diese Arbeit stellt drei verschiedene Verfahren vor mit denen ermittelt werden soll, auf welchen Bildern der beiden Gruppen der gleiche Kammmolch abgebildet ist . Zur Identifikation der Molche werden in einem ersten Verfahren die Histogramme zweier Bilder verglichen. Hierfür werden alle Bilder in Grauwertbilder umgewandelt Eine statistische Kenngröße entscheidet über die Gleichheit der Motive. Das zweite Verfahren, das wir anwenden, ist wesentlich aufwendiger. Es handelt sich um eine Merkmalbasierte Zuordnung der Bilder. Wir wollen herausfinden wie viele gemeinsame markante Punkte man in zwei Bildern finden kann. Über die Anzahl dieser wollen wir entscheiden, ob es sich um gleiche Kammmolche handelt. Bei diesem Verfahren wird ein Detektor angewendet, der im Bild homogene Flächen, wie die Flecken der Bauchmusterung der Kammmolche, findet. Über die Eigenschaften dieser gefundenen markanten Punkte vergleichen wir, welche Punkte zweier Bilder zusammenpassen. In unserem letzten Verfahren wenden wir eine affine Transformation an. Dies hat den Zweck, dass wir die Kammmolche von zwei Bildern aufeinander transformieren und so durch Differenzbildung der Farbwerte über eine Ähnlichkeit der Tiere entscheiden können. Die Evaluation der Ergebnisse hat gezeigt, dass der Histogrammvergleich nicht geeignet zur Identifikation ist. Es wurden nur 5,8% der Bilderpaare mit gleichem Kammmolch ermittelt. Ebenso hat die Transformation der Bilder zur Ähnlichkeitserkennung schlechte Ergebnisse abgeliefert. 8,8% Trefferquote. Nur die merkmalsbasierende Zuordnung hat zufriedenstellende Ergebnisse geliefert. Hier konnten 84,2% der Bilderpaare mit gleichem Motiv ermittelt werden. Vor allem die Kopfmusterung der Tiere hat sich als sehr geeignet zur Identifizierung gezeigt. Bei optimaler Fotografie der Tiere können mit diesem Verfahren 100% Trefferquote erreicht werden.
Abstract
Identification of crested newts
The aim of this project is to develop an automated identification process for crested newts. Two sets of images each one showing photographed crested newts, will be used for that purpose. The following paper suggests three different methods devised to match crested newts from the two sets. The first method consists of comparing the histograms of two images. For this purpose, every photograph will be converted into a gray -scale image. A statistical parameter wil1 determine the match of the specimen. The feature-based classification of images provides a second, considerably more complex method of achieving this project's goal. Two photographs are compared to reveal a number of distinct similarities, the number of which will be significant in determining a match. This method makes use of a detector to find homogeneous areas, such as parts of the pattern on the belly of a crested newt. Acquired information may then be used to determine possible matches between two images. Affine transformation forms the core of the third and final method. Possible matches will be determined by projecting two photographs of crested newts on top of each other. Subtraction of color values will help form a decision on the similarity of the two animals. Evaluation of the results has shown that histogram comparison is not suitable for identification. Only 5.8% of matches could be found by using this method. Similarly, the transformation of images to determine similarities has delivered poor results .8.8% of matches were found. Solely the feature-based mapping has provided satisfactory results. 84.2% of matching pairs displaying the same pattern could be identified. The animals' head patterns turned out to be especially suitable for the identification process. Optimal photography provided, a 100 % hit rate can be achieved by using this method.
Identifikation von Kammmolchen
Ziel dieser Arbeit ist es die Identifikation von Kammmolchen zu automatisieren. Gegeben sind zwei Gruppen mit jeweils 34 Kammmolchbildern. Diese Arbeit stellt drei verschiedene Verfahren vor mit denen ermittelt werden soll, auf welchen Bildern der beiden Gruppen der gleiche Kammmolch abgebildet ist . Zur Identifikation der Molche werden in einem ersten Verfahren die Histogramme zweier Bilder verglichen. Hierfür werden alle Bilder in Grauwertbilder umgewandelt Eine statistische Kenngröße entscheidet über die Gleichheit der Motive. Das zweite Verfahren, das wir anwenden, ist wesentlich aufwendiger. Es handelt sich um eine Merkmalbasierte Zuordnung der Bilder. Wir wollen herausfinden wie viele gemeinsame markante Punkte man in zwei Bildern finden kann. Über die Anzahl dieser wollen wir entscheiden, ob es sich um gleiche Kammmolche handelt. Bei diesem Verfahren wird ein Detektor angewendet, der im Bild homogene Flächen, wie die Flecken der Bauchmusterung der Kammmolche, findet. Über die Eigenschaften dieser gefundenen markanten Punkte vergleichen wir, welche Punkte zweier Bilder zusammenpassen. In unserem letzten Verfahren wenden wir eine affine Transformation an. Dies hat den Zweck, dass wir die Kammmolche von zwei Bildern aufeinander transformieren und so durch Differenzbildung der Farbwerte über eine Ähnlichkeit der Tiere entscheiden können. Die Evaluation der Ergebnisse hat gezeigt, dass der Histogrammvergleich nicht geeignet zur Identifikation ist. Es wurden nur 5,8% der Bilderpaare mit gleichem Kammmolch ermittelt. Ebenso hat die Transformation der Bilder zur Ähnlichkeitserkennung schlechte Ergebnisse abgeliefert. 8,8% Trefferquote. Nur die merkmalsbasierende Zuordnung hat zufriedenstellende Ergebnisse geliefert. Hier konnten 84,2% der Bilderpaare mit gleichem Motiv ermittelt werden. Vor allem die Kopfmusterung der Tiere hat sich als sehr geeignet zur Identifizierung gezeigt. Bei optimaler Fotografie der Tiere können mit diesem Verfahren 100% Trefferquote erreicht werden.
Abstract
Identification of crested newts
The aim of this project is to develop an automated identification process for crested newts. Two sets of images each one showing photographed crested newts, will be used for that purpose. The following paper suggests three different methods devised to match crested newts from the two sets. The first method consists of comparing the histograms of two images. For this purpose, every photograph will be converted into a gray -scale image. A statistical parameter wil1 determine the match of the specimen. The feature-based classification of images provides a second, considerably more complex method of achieving this project's goal. Two photographs are compared to reveal a number of distinct similarities, the number of which will be significant in determining a match. This method makes use of a detector to find homogeneous areas, such as parts of the pattern on the belly of a crested newt. Acquired information may then be used to determine possible matches between two images. Affine transformation forms the core of the third and final method. Possible matches will be determined by projecting two photographs of crested newts on top of each other. Subtraction of color values will help form a decision on the similarity of the two animals. Evaluation of the results has shown that histogram comparison is not suitable for identification. Only 5.8% of matches could be found by using this method. Similarly, the transformation of images to determine similarities has delivered poor results .8.8% of matches were found. Solely the feature-based mapping has provided satisfactory results. 84.2% of matching pairs displaying the same pattern could be identified. The animals' head patterns turned out to be especially suitable for the identification process. Optimal photography provided, a 100 % hit rate can be achieved by using this method.
[ BibTex ]
@MASTERSTHESIS{olinger11:identifikation,
title={Identifikation von Kammmolchen},
year={2011},
school={Institute of Photogrammetry, University of Bonn},
type={bachelor thesis},
}
Sardemann, Hannes:
Registrierung von Bildern mit 3D- Punktwolken
Bachelorarbeit, Bonn 2011
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.- Ing Falko Schindler [ BibTex ]
@MASTERSTHESIS{sardemann11:registrierung,
author={Sardemann, Hannes},
title={Registrierung von Bildern mit 3D- Punktwolken},
school={Institute of Photogrammetry, University of Bonn},
year={2011},
type={bachelor thesis},
}
Schittenhelm, Jörg:
Empirische Untersuchungen zum Einsatz des SFOP-Punktdetektors zur Objektdetektion
Diplomarbeit, Bonn 2011
Betreuung: Prof. Dr.- Ing. Wolfgang Förstner, Dipl.-Ing. Falko Schindler download
752 K
[ Zusammenfassung ]
siehe download
[ BibTex ]
@MASTERSTHESIS{schittenhelm11:empirische,
author={Schittenhelm, J\"{o}rg},
title={{Empirische Untersuchungen zum Einsatz des SFOP-Punktdetektors zur Objektdetektion}},
year={2011},
school={University of Bonn},
type={diploma thesis},
city={Bonn},
}
Schneider, Johannes:
Lösung von Orientierungsaufgaben der Photogrammetrie mit konvexer Optimierung
Masterarbeit, Bonn 2011
Betreuung: Prof. Dr.-Ing. Dr. h.c. mult. Wolfgang Förstner, Dipl.-Ing. Falko Schindler, Dipl.-Ing. Lutz Roese-Koerner [ Zusammenfassung ]
Zusammenfassung:
Diese Arbeit beschäftigt sich mit der Lösung von geometrischen Optimierungsproblemen der Photogrammetrie mittels Techniken der konvexen Optimierung. Durch Hartley und Schaffalitzky (2004) wurde erstmals vorgeschlagen, geometrische Probleme durch die Minimierung der L∞-Norm der Residuen zu lösen, da sie als konvexes Optimierungsproblem formulierbar sind und so das Erreichen des globalen Minimums garantieren. Seitdem sind stetig neue Verfahren veröffentlicht worden, mit welchen es möglich ist, ohne Näherungswerte die geometrisch sinnvolle L∞-Lösung einiger geometrischer Aufgabenstellungen zu bestimmen.
In der Photogrammetrie werden Orientierungsaufgaben üblicherweise mit Hilfe der Ausgleichungsrechnung gelöst. Falls die Beobachtungen normalverteilten Abweichungen unterliegen, befindet sich der erwartungstreue Schätzer mit minimaler Varianz am globalen Minimum der L2-Kostenfunktion. Wegen der Nichtlinearität der Kostenfunktion sind Näherungswerte für die unbekannten Parameter erforderlich, die bspw. mit Hilfe eines Gauß-Newton-Verfahrens iterativ verbessert werden. Konvergenz zum globalen Minimum ist bei diesem Vorgehen jedoch nicht garantiert, da die L2-Kostenfunktion i. a. mehrere lokale Minima besitzen kann.
In dieser Masterarbeit wird der Ansatz von Hartley und Schaffalitzky (2004) dargestellt, mit der Ausgleichungsrechnung verglichen und an den photogrammetrischen Verfahren räumlicher Vorwärtsschnitt, Homographie-Schätzung, Bündelausgleichung mit bekannten Rotationen, räumlicher Rückwärtsschnitt und relative Orientierung, auf seine Leistungsfähigkeit hin untersucht.
Zu Beginn dieser Arbeit sind die für das Verständnis der Arbeit notwendigen Grundlagen der mathematischen Optimierung dargestellt. Es wird speziell auf die statistische Bedeutung der Minimierung der L2- und der L∞-Norm eingegangen und aufgezeigt, wie eine Kostenfunktion mittels des Newton-Verfahrens numerisch minimiert werden kann. Zudem werden Grundlagen zur konvexen Optimierung dargestellt, welche zum Erkennen konvexer und quasikonvexer Optimierungsprobleme dienen und die Lösbarkeit dieser Optimierungsprobleme mittels Innerer-Punkte-Verfahren darlegt. Die Ausführungen sind für das Verständnis der Lösungsverfahren zur Bestimmung der L∞-Lösung notwendig.
In dieser Arbeit betrachten wir speziell drei geometrische Optimierungsprobleme, deren L∞-Lösungen durch iteratives Lösen eines konvexen Zulässigkeitsproblems mit quadratischen Kegelrestriktionen („Second-order Cone Programm“) innerhalbeines Bisektionsverfahrens bestimmbar sind: Den räumlichen Vorwärtsschnitt, die Homographie-Schätzung und die Bündelausgleichung bei bekannten Rotationen. Die implementierten Verfahren wurden auf synthetisch generierten Daten getestet und anhand der Verteilung der Residuen unter der jeweiligen L∞-Lösung konnten die statistischen Eigenschaften der L∞-Schätzer verifiziert werden. Zum Vergleich des Genauigkeitsniveaus der L2- und L∞-Lösung wurde mittels einer Monte-Carlo-Simulation die empirische Kovarianzmatrix abgeleitet, mittels welcher der Helmertsche-Punktfehler der L2- und der L∞-Lösung verglichen werden kann. Hierbei lieferte die L2-Lösung bei normalverteilten Beobachtungsabweichungen unter verschiedenen Rauschniveaus stets die qualitativ beste Lösung. Die L∞-Lösung nahm häufig ähnliche Werte wie die L2-Lösung an und das Genauigkeitsniveau war durchgehend sehr ähnlich. Die L∞-Lösung reagiert jedoch stärker auf extreme Beobachtungsabweichungen. Bei einem hohen Rauschniveau wächst der Helmertsche Punktfehler signifikant stärker an als der Punktfehler der L2-Lösung.
Falls ein Ausreißer in den Beobachtungen vorliegt, so wird die L∞-Lösung stark verfälscht, da der Ausreißer ein großes Residuum erzeugt. Zur Ausreißerdetektion bei den drei genannten Verfahren wird die von Lee et al. (2010) vorgeschlagene konvexe SOI-Minimierung dargestellt, welche eine Lösung sucht, unter welcher die Summe der Unzulässigkeiten gegenüber den durch die Beobachtungen aufgespannten Kegelrestriktionen minimal ist. Beobachtungen, welche unzulässige Restriktionen erzeugen, können dann als Ausreißer identifiziert werden. Die SOI-Minimierung hat auf den syntetisch generierten Konfigurationen stets alle generierten Ausreißer detektiert, jedoch wurde durchgehend eine gewisse Anzahl fälschlicherweise als Ausreißer identifiziert.
Weiterhin wurde das von Hartley und Kahl (2009) veröffentlichte Lösungsverfahren untersucht, mit welchem sogar Rotationen mittels einer Branch-and-Bound-Suche im dreidimensionalen Rotationsraum bestimmt werden können. Dieses Verfahren ermöglicht es auch die L∞-Lösung des räumlichen Rückwärtsschnitts und der relativen Orientierung stets ohne Näherungswerte zu bestimmen. Neben der theoretischen Aufarbeitung wurden beide Verfahren implementiert und durch Anwendung auf simulierte Datensätze getestet.
Es konnte in dieser Arbeit anhand von synthetisch generierten Datensätzen gezeigt werden, dass die Abweichungen zwischen der L∞-Lösung und der L2-Lösung nicht sehr groß sind. Die L∞-Lösung eignet sich daher als Näherungswert zur Initialisierung einer L2-Minimierung. Mittels iterativer Lösungsverfahren, wie bspw. einer Bündelausgleichung, kann die L∞ -Lösung durch Minimierung der L2-Kostenfunktion verbessert werden.
Die untersuchten Probleme konnten effizient durch Lösen von Second-order Cone Programmen mittels Innere-Punkte-Verfahren gelöst werden. Zur Lösung der konvexen Optimierungsprobleme wurde das Open-Source-Programmpaket „SeDuMi“ verwendet. Die Laufzeit dieser Algorithmen ist zwar bei weitem nicht so schnell wie eine Kleinste-Quadrate-Schätzung, jedoch bei der Lösung nicht allzu großer Probleme anwendbar.
Abstract:
This thesis is concerned with solving geometric optimization problems in photogrammetry using methods of convex optimization. Hartley und Schaffalitzky (2004) first suggested solving geometric problems by minimizing the L∞-norm of the residuals, so that they can be written as convex optimization problems and as such obtain the global minimum. Since then new methods, allowing to determine the statistically and geometrically meaningful L∞-solution without approximate values, have constantly been published.
In the field of photogrammetry calibration tasks are usually solved using adjustment theory. If the observations show normally distributed derivations, the unbiased estimator with a minimal variance is at the global minimum of the L2-cost function. Because of the nonlinearity of the cost function approximate values for the unknown parameters are needed. These can be improved using, for instance, the iterative Gauss-Newton's method. This method does however not guarantee convergence to the global minimum as the L2-cost function can generally have several local minima.
In this thesis the approach of Hartley und Schaffalitzky (2004) is described, compared with the adjustment theory, and its capability is tested on photogrammetric methods such as triangulation, homography estimation, bundle adjustment with known camera orientation, pose estimation and relative pose estimation.
At the beginning of this thesis, the necessary basics of mathematical optimization are explained. Special focus is put on the statistical meaning of minimizing the L2-and the L∞-norm, and it is explained how a cost function can be numerically minimized using the Newton's method. Moreover, basics concerning convex optimization, allowing to identify and to solve convex as well as quasi-convex optimization problems with interior-point methods, are presented. These explanations are necessary to understand the methods used to solve the problem of determining the L∞-solution.
This thesis focuses on three geometrical optimization problems whose L∞-solutions are determinable by solving iterativly a convex feasability problem with second order cone constraints within a bisection method: triangulation, homography estimation and bundle adjustment with known camera orientation. The implemented methods were tested on synthetically generated data, and the statistical properties of L∞-estimators could be verified on the basis of the distribution of residuals under the corresponding L∞ -solution. To compare the level of accuracy of the L2- and the L∞-solution the empirical covariance matrix was deduced with the help of a Monte-Carlo simulation. This covariance matrix allows the comparison of the Helmert-point error of the L2 and L∞-solution. The L2-solution always showed the most certain solution in normally distributed observation derivations on different noise levels. The L∞-solution showed results similar to those of the L2-solution. The influence of extreme observation residuals is however stronger on the L∞-solution. On a high noise level the Herlmert-point error has a significantly stronger influence on the point error of the L2-solution.
If observations contain an outlier, the L∞-solution is strongly influenced as the outlier creates a big residual. Convex SOI-minimization, minimizing the sum of infeasibilities, suggested by Lee et al. (2010), is presented as it permits the detection of outliers in the three methods. Observations creating infeasible restrictions can be identified as outliers. SOI-minimization has always detected all the generated outliers in the synthetically generated configurations. A certain number of true inliers were however wrongly identified as outliers.
Furthermore, a solution method published by Hartley und Kahl (2009), allowing to determine rotations by searching three-dimensional rotation space with branch-and-bound, is presented. This branch-and-bound method permits the determination of the L∞-solution of pose estimation and relative pose estimation without approximate values. In addition to their theoretical presentation, both methods were implemented and tested by applying them on synthetic data sets.
On the basis of synthetically generated data sets it could be shown in this thesis that the differences between the L2- und L∞-solutions are not big. The L∞-solution is therefore a suitable approximate value to initialize a L2-minimization. Iterative refinement techniques minimizing the L2 -cost function, such as bundle adjustment, can be used to improve the L∞-estimates.
The examined optimization problems could effciently be solved as second order cone programms using interior point methods. To solve the convex optimization problems the open source software package “SeDuMi” is used. The runtime of these algorithms is by far not as fast as least squares methods but practicable to solve problems that are not overly big.
Diese Arbeit beschäftigt sich mit der Lösung von geometrischen Optimierungsproblemen der Photogrammetrie mittels Techniken der konvexen Optimierung. Durch Hartley und Schaffalitzky (2004) wurde erstmals vorgeschlagen, geometrische Probleme durch die Minimierung der L∞-Norm der Residuen zu lösen, da sie als konvexes Optimierungsproblem formulierbar sind und so das Erreichen des globalen Minimums garantieren. Seitdem sind stetig neue Verfahren veröffentlicht worden, mit welchen es möglich ist, ohne Näherungswerte die geometrisch sinnvolle L∞-Lösung einiger geometrischer Aufgabenstellungen zu bestimmen.
In der Photogrammetrie werden Orientierungsaufgaben üblicherweise mit Hilfe der Ausgleichungsrechnung gelöst. Falls die Beobachtungen normalverteilten Abweichungen unterliegen, befindet sich der erwartungstreue Schätzer mit minimaler Varianz am globalen Minimum der L2-Kostenfunktion. Wegen der Nichtlinearität der Kostenfunktion sind Näherungswerte für die unbekannten Parameter erforderlich, die bspw. mit Hilfe eines Gauß-Newton-Verfahrens iterativ verbessert werden. Konvergenz zum globalen Minimum ist bei diesem Vorgehen jedoch nicht garantiert, da die L2-Kostenfunktion i. a. mehrere lokale Minima besitzen kann.
In dieser Masterarbeit wird der Ansatz von Hartley und Schaffalitzky (2004) dargestellt, mit der Ausgleichungsrechnung verglichen und an den photogrammetrischen Verfahren räumlicher Vorwärtsschnitt, Homographie-Schätzung, Bündelausgleichung mit bekannten Rotationen, räumlicher Rückwärtsschnitt und relative Orientierung, auf seine Leistungsfähigkeit hin untersucht.
Zu Beginn dieser Arbeit sind die für das Verständnis der Arbeit notwendigen Grundlagen der mathematischen Optimierung dargestellt. Es wird speziell auf die statistische Bedeutung der Minimierung der L2- und der L∞-Norm eingegangen und aufgezeigt, wie eine Kostenfunktion mittels des Newton-Verfahrens numerisch minimiert werden kann. Zudem werden Grundlagen zur konvexen Optimierung dargestellt, welche zum Erkennen konvexer und quasikonvexer Optimierungsprobleme dienen und die Lösbarkeit dieser Optimierungsprobleme mittels Innerer-Punkte-Verfahren darlegt. Die Ausführungen sind für das Verständnis der Lösungsverfahren zur Bestimmung der L∞-Lösung notwendig.
In dieser Arbeit betrachten wir speziell drei geometrische Optimierungsprobleme, deren L∞-Lösungen durch iteratives Lösen eines konvexen Zulässigkeitsproblems mit quadratischen Kegelrestriktionen („Second-order Cone Programm“) innerhalbeines Bisektionsverfahrens bestimmbar sind: Den räumlichen Vorwärtsschnitt, die Homographie-Schätzung und die Bündelausgleichung bei bekannten Rotationen. Die implementierten Verfahren wurden auf synthetisch generierten Daten getestet und anhand der Verteilung der Residuen unter der jeweiligen L∞-Lösung konnten die statistischen Eigenschaften der L∞-Schätzer verifiziert werden. Zum Vergleich des Genauigkeitsniveaus der L2- und L∞-Lösung wurde mittels einer Monte-Carlo-Simulation die empirische Kovarianzmatrix abgeleitet, mittels welcher der Helmertsche-Punktfehler der L2- und der L∞-Lösung verglichen werden kann. Hierbei lieferte die L2-Lösung bei normalverteilten Beobachtungsabweichungen unter verschiedenen Rauschniveaus stets die qualitativ beste Lösung. Die L∞-Lösung nahm häufig ähnliche Werte wie die L2-Lösung an und das Genauigkeitsniveau war durchgehend sehr ähnlich. Die L∞-Lösung reagiert jedoch stärker auf extreme Beobachtungsabweichungen. Bei einem hohen Rauschniveau wächst der Helmertsche Punktfehler signifikant stärker an als der Punktfehler der L2-Lösung.
Falls ein Ausreißer in den Beobachtungen vorliegt, so wird die L∞-Lösung stark verfälscht, da der Ausreißer ein großes Residuum erzeugt. Zur Ausreißerdetektion bei den drei genannten Verfahren wird die von Lee et al. (2010) vorgeschlagene konvexe SOI-Minimierung dargestellt, welche eine Lösung sucht, unter welcher die Summe der Unzulässigkeiten gegenüber den durch die Beobachtungen aufgespannten Kegelrestriktionen minimal ist. Beobachtungen, welche unzulässige Restriktionen erzeugen, können dann als Ausreißer identifiziert werden. Die SOI-Minimierung hat auf den syntetisch generierten Konfigurationen stets alle generierten Ausreißer detektiert, jedoch wurde durchgehend eine gewisse Anzahl fälschlicherweise als Ausreißer identifiziert.
Weiterhin wurde das von Hartley und Kahl (2009) veröffentlichte Lösungsverfahren untersucht, mit welchem sogar Rotationen mittels einer Branch-and-Bound-Suche im dreidimensionalen Rotationsraum bestimmt werden können. Dieses Verfahren ermöglicht es auch die L∞-Lösung des räumlichen Rückwärtsschnitts und der relativen Orientierung stets ohne Näherungswerte zu bestimmen. Neben der theoretischen Aufarbeitung wurden beide Verfahren implementiert und durch Anwendung auf simulierte Datensätze getestet.
Es konnte in dieser Arbeit anhand von synthetisch generierten Datensätzen gezeigt werden, dass die Abweichungen zwischen der L∞-Lösung und der L2-Lösung nicht sehr groß sind. Die L∞-Lösung eignet sich daher als Näherungswert zur Initialisierung einer L2-Minimierung. Mittels iterativer Lösungsverfahren, wie bspw. einer Bündelausgleichung, kann die L∞ -Lösung durch Minimierung der L2-Kostenfunktion verbessert werden.
Die untersuchten Probleme konnten effizient durch Lösen von Second-order Cone Programmen mittels Innere-Punkte-Verfahren gelöst werden. Zur Lösung der konvexen Optimierungsprobleme wurde das Open-Source-Programmpaket „SeDuMi“ verwendet. Die Laufzeit dieser Algorithmen ist zwar bei weitem nicht so schnell wie eine Kleinste-Quadrate-Schätzung, jedoch bei der Lösung nicht allzu großer Probleme anwendbar.
Abstract:
This thesis is concerned with solving geometric optimization problems in photogrammetry using methods of convex optimization. Hartley und Schaffalitzky (2004) first suggested solving geometric problems by minimizing the L∞-norm of the residuals, so that they can be written as convex optimization problems and as such obtain the global minimum. Since then new methods, allowing to determine the statistically and geometrically meaningful L∞-solution without approximate values, have constantly been published.
In the field of photogrammetry calibration tasks are usually solved using adjustment theory. If the observations show normally distributed derivations, the unbiased estimator with a minimal variance is at the global minimum of the L2-cost function. Because of the nonlinearity of the cost function approximate values for the unknown parameters are needed. These can be improved using, for instance, the iterative Gauss-Newton's method. This method does however not guarantee convergence to the global minimum as the L2-cost function can generally have several local minima.
In this thesis the approach of Hartley und Schaffalitzky (2004) is described, compared with the adjustment theory, and its capability is tested on photogrammetric methods such as triangulation, homography estimation, bundle adjustment with known camera orientation, pose estimation and relative pose estimation.
At the beginning of this thesis, the necessary basics of mathematical optimization are explained. Special focus is put on the statistical meaning of minimizing the L2-and the L∞-norm, and it is explained how a cost function can be numerically minimized using the Newton's method. Moreover, basics concerning convex optimization, allowing to identify and to solve convex as well as quasi-convex optimization problems with interior-point methods, are presented. These explanations are necessary to understand the methods used to solve the problem of determining the L∞-solution.
This thesis focuses on three geometrical optimization problems whose L∞-solutions are determinable by solving iterativly a convex feasability problem with second order cone constraints within a bisection method: triangulation, homography estimation and bundle adjustment with known camera orientation. The implemented methods were tested on synthetically generated data, and the statistical properties of L∞-estimators could be verified on the basis of the distribution of residuals under the corresponding L∞ -solution. To compare the level of accuracy of the L2- and the L∞-solution the empirical covariance matrix was deduced with the help of a Monte-Carlo simulation. This covariance matrix allows the comparison of the Helmert-point error of the L2 and L∞-solution. The L2-solution always showed the most certain solution in normally distributed observation derivations on different noise levels. The L∞-solution showed results similar to those of the L2-solution. The influence of extreme observation residuals is however stronger on the L∞-solution. On a high noise level the Herlmert-point error has a significantly stronger influence on the point error of the L2-solution.
If observations contain an outlier, the L∞-solution is strongly influenced as the outlier creates a big residual. Convex SOI-minimization, minimizing the sum of infeasibilities, suggested by Lee et al. (2010), is presented as it permits the detection of outliers in the three methods. Observations creating infeasible restrictions can be identified as outliers. SOI-minimization has always detected all the generated outliers in the synthetically generated configurations. A certain number of true inliers were however wrongly identified as outliers.
Furthermore, a solution method published by Hartley und Kahl (2009), allowing to determine rotations by searching three-dimensional rotation space with branch-and-bound, is presented. This branch-and-bound method permits the determination of the L∞-solution of pose estimation and relative pose estimation without approximate values. In addition to their theoretical presentation, both methods were implemented and tested by applying them on synthetic data sets.
On the basis of synthetically generated data sets it could be shown in this thesis that the differences between the L2- und L∞-solutions are not big. The L∞-solution is therefore a suitable approximate value to initialize a L2-minimization. Iterative refinement techniques minimizing the L2 -cost function, such as bundle adjustment, can be used to improve the L∞-estimates.
The examined optimization problems could effciently be solved as second order cone programms using interior point methods. To solve the convex optimization problems the open source software package “SeDuMi” is used. The runtime of these algorithms is by far not as fast as least squares methods but practicable to solve problems that are not overly big.
[ BibTex ]
@MASTERSTHESIS{schneider11:loesung,
author = "Schneider, Johannes",
title = "L\"{o}sung von Orientierungsaufgaben der Photogrammetrie mit konvexer Optimierung",
school="Department of Photogrammetry, University of Bonn",
type="Master Thesis",
year = "2011",
}
Schoppohl, Sebastian Alexander:
Klassifikation von Multispektralen und Hyperspektralen Fernerkundungsdaten mittels sequentieller Klassifikationsverfahren
Bachelorarbeit, Bonn 2011
Betreuung: Prof. Dr. Björn Waske, Dipl.-Ing. Ribana Roscher [ Zusammenfassung ]
Abstract
Geography, climate and vegetation - elements in today’s changing. These changes have to be observed and analyzed in detail. To assure being up-to-date the classification of image data is a common procedure in remote sensing. For the implementation of image data classification many classification methods were developed and modified over the past years. The classification methods, the image data and the study area mainly affect the classification accuracy. In particular the progress of increasing training data showed a boost of classification accuracy. Though the costs and expenditure of time are very high in purchasing such training data. Nevertheless so called semi-supervised classification methods try to resolve this problem. In this bachelor thesis the focus is set on the Random Forest developed by Breiman. This classifier is combined with an incremental method. After this the classifier is able to generate new training data. Hence we implement the self-training method. To create an incremental Random Forest we proceed in several phases. First we train a conventional Random Forest with a small set of training data. In a second Phase the predicted classification is made. This allows pixel whose land use classes are unknown to be provided with pseudo-classes. At the same time the accuracy assessment is made on the trained Random Forest. For this we use the predefined test data from the given dataset. In a third stage the selection of the new training data is made. We define a threshold, so the new training data is not randomly selected. The confidence level of the new training data is measured on this threshold. If there is a sufficient number of new training data, which reach or exceed this confidence level, the new training data is added to the existing training data. On this basis a new Random Forest can be trained. This sequential process is determined by a specified iteration, or is stopped prematurely by a stopping criterion. Afterwards it is possible to classify a multi-spectral and hyperspectral dataset The assessment concluded that the combination parameters of the incremental Random Forest have a crucial impact on the classification results. Depending on the data set various configurations of parameters have to be tested. While comparing the conventional Random Forest with the incremental Random Forest partly significant differences in the classification results are obvious. Furthermore it should be noted that only a few class accuracy could be increased with the incremental Random Forest. Though the present thesis provides a good foundation to exploit the potential of the incremental Random Forest for further investigations.
Geography, climate and vegetation - elements in today’s changing. These changes have to be observed and analyzed in detail. To assure being up-to-date the classification of image data is a common procedure in remote sensing. For the implementation of image data classification many classification methods were developed and modified over the past years. The classification methods, the image data and the study area mainly affect the classification accuracy. In particular the progress of increasing training data showed a boost of classification accuracy. Though the costs and expenditure of time are very high in purchasing such training data. Nevertheless so called semi-supervised classification methods try to resolve this problem. In this bachelor thesis the focus is set on the Random Forest developed by Breiman. This classifier is combined with an incremental method. After this the classifier is able to generate new training data. Hence we implement the self-training method. To create an incremental Random Forest we proceed in several phases. First we train a conventional Random Forest with a small set of training data. In a second Phase the predicted classification is made. This allows pixel whose land use classes are unknown to be provided with pseudo-classes. At the same time the accuracy assessment is made on the trained Random Forest. For this we use the predefined test data from the given dataset. In a third stage the selection of the new training data is made. We define a threshold, so the new training data is not randomly selected. The confidence level of the new training data is measured on this threshold. If there is a sufficient number of new training data, which reach or exceed this confidence level, the new training data is added to the existing training data. On this basis a new Random Forest can be trained. This sequential process is determined by a specified iteration, or is stopped prematurely by a stopping criterion. Afterwards it is possible to classify a multi-spectral and hyperspectral dataset The assessment concluded that the combination parameters of the incremental Random Forest have a crucial impact on the classification results. Depending on the data set various configurations of parameters have to be tested. While comparing the conventional Random Forest with the incremental Random Forest partly significant differences in the classification results are obvious. Furthermore it should be noted that only a few class accuracy could be increased with the incremental Random Forest. Though the present thesis provides a good foundation to exploit the potential of the incremental Random Forest for further investigations.
[ BibTex ]
@MASTERSTHESIS{schoppohl11:klassifikation,
author={Schoppohl, Sebastian-Alexander},
title={Klassifikation von Multispektralen und Hyperspektralen Fernerkundungsdaten mittels sequentieller Klassifikationsverfahren},
school={Institute of Photogrammetry},
year={2011},
type={bachelor thesis}
}
Stefanski, Jan:
Klassifikation hochauflösender TerraSAR-X Daten urbaner Räume
Masterarbeit, Bonn 2011
Betreuung: Prof. Dr. Björn Waske, Dipl.- Ing. Ribana Roscher [ Zusammenfassung ]
Zusammenfassung
Weltweit ist eine steigende Urbanisierung und Suburbanisierung zu verzeichnen. Um die stetig wachsende Versiegelung untersuchen zu können, erweist es sich als vorteilhaft, dass die aktuellen Entwicklungen bei den Fernerkundungssensoren zu einer besseren räumlichen Auflösung beitragen. Dies ermöglicht eine zunehmend genauere Differenzierung urbaner Strukturen. In dieser Arbeit ist eine effiziente Strategie zur Klassifikation von hochaufgelösten TerraSAR-X Daten urbaner Räume erstellt und umgesetzt worden. Zu diesem Zweck wurden in den ersten bei den Kapiteln zunächst Grundlagen, Vorverarbeitungsschritte sowie die genutzten Daten vorgestellt. Im Grundlagenkapitel werden vor allem die Merkmale dargelegt, mit denen im Random Forest die Klassifikation durchgeführt wird. Dies sind zum einen die Texturmaße, die zu einem Informationszugewinn führen. Zum anderen konnte das Klassifikationsergebnis durch die Nutzung von Segmentierungsalgorithmen verbessert werden. Weiterhin zeigte sich, dass mit der Nutzung eines Speckle-Filters vor den Berechnungen der Texturmaße aus Co-Occurrence Matrizen das Gesamtergebnis optimiert werden konnte. Anschließend wurden im Auswertungskapitel Ergebnisse und daraus resultierende Erkenntnisse diskutiert. Es konnte ein adäquates Konzept zur Klassifikation der TerraSAR-X Daten der Region Kamen in Nordrhein- Westfalen entwickelt werden. Der Random Forest bewährte sich als schneller und effizienter Klassifikator von großen Datenmengen. Des Weiteren eignete sich der Random Forest ideal für eine Sensorfusion mit zusätzlichen optischen Daten der Rapideye Satelliten. Im Rahmen der Untersuchungen der Texturmaße zur Klassifikation urbaner Räume zeigte sich, dass Texturmaße aus Co-Occurrence-Matrizen gegenüber den Semivariogrammen und Texturmaßen aus Histogrammen am besten zum Klassifikationserfolg beitragen konnten. Die Fenstergröße ist ein wichtiger Parameter der Texturmaße und es zeigte sich, dass mit größeren Rechteckumgebungen zur Berechnung der Texturmaße i. d. R. bessere Ergebnisse erzielt werden konnten. Allerdings müssen die damit einhergehenden Folgen wie der Verlust von kleinen Details und die Tendenz zur Blockbildung bei der anschließenden Klassifikation beachtet werden. Zur Segmentierung der Radardaten sind verschiedene Verfahren untersucht worden. Dabei zeigte sich, dass das Klassifikationsergebnis auf Basis der Segmente des Superpixel Contour Relaxation Algorithmus die anderen Segmentierungsansätze übertrifft. Das beste Ergebnis erzielte dieser Algorithmus mit einer 3- Level-Segmentierung, welche unterschiedliche Segment größen umfasst. Darüber hinaus zeigte sich, dass die Markov Random Fields gut geeignet sind, um das Klassifikationsergebnis des Random Forest weiter zu verbessern. Auf Grund der Bildung homogener Regionen durch die Markov Random Fields wurden pixelweise Fehlklassifikationen korrigiert und das Gesamtbild verbessert. Aus den beschriebenen Verfahren wurde ein "ideales Konzept" erstellt, welches zum genauesten Klassifikationsergebnis führt. Dazu gehört neben den Berechnungen auf Basis der TerraSAR-X Daten auch die Nutzung optischer Daten. Durch die Sensorfusion im Random Forest können die Stärken bei der Sensorsysteme zur Steigerung des KIassifikationserfolgs genutzt werden.
Abstract
An increasing global urbanization and suburbanization can be observed. To monitor the growing sealing, it is advantageous that the recent developments in remote sensing improve spatial resolution. The advent of a new sensor generation offers a more precise differentiation of urban environments. Therefore, we can use different types of sensors (e.g., microwave, multispectral), each with different strengths and weaknesses. These sensors operate at different wavelengths and thus provide different information. In combination with Earth observation systems, global land cover information can be acquired rapidly. Synthetic Aperture Radar (SAR) is an active remote sensing technique highly sensitive to geometrical configurations and dielectric properties. SAR sensors are capable to receive microwaves independently from daytime and weather conditions. Hence, SAR satellites offer the advantage to play a key role in urban monitoring during time critical events like natural hazards (Sorgel, 2010). For example SAR data have been used for mitigation and damage assessment during flooding (Voigt u. a., 2005) and after the earthquake in Taiwan (Takeuchi u. a., 2000). Furthermore, this technology can provide gapless and full usable time series. There are many more applications, SAR data can be used for. The properties of microwaves allow for example to gather land cover information in tropical zones or to monitor glaciers or oil leaks (Sorgel, 2010). In this thesis, an efficient strategy for the classification of high resolution TerraSAR-X data (Werninghaus u. Buckreuss, 2010) covering urban areas has been developed and implemented. To achieve this, we use state of the art textural and segmentation procedures. The first chapter introduces some basics and focuses on the Random Forest (RF) (Breiman, 2001) classification and its features. The Random Forest is a supervised classifier, so a set of training data is, necessary. It is an ensemble classifier that consists of many decision trees. The output is a majority vote of all decision trees for a class. Random Forest is a fast and efficient algorithm capable to classify large amounts of multisensor data. To improve the classification accuracy, we use textural features which lead to an information gain (Dekker, 2003). Since the TerraSAR-X sensor is single band, texture measures are useful to gain additional information. The principle is that textural information of the neighbourhood of each pixel is calculated within a moving window. Over the years a great number of texture measures have been developed. In this thesis we investigated texture measures that have been proved for SAR data like histogram measures, grey-level co-occurrence measures and semivariograms (Dekker (2003), Haralick u. a. (1973), Carr u. de Miranda (1998), Dell' Acqua u. Gamba (2006)). SAR data has the noise-like characteristic of speckle. In this thesis we used the gamma filter with a window width of 7 x 7 to reduce the effect of speckle. It was shown that the use of speckle filters before calculating the textural measures from co-occurrence matrices optimized the overall accuracy. The classification accuracy could be further improved by the use of segmentation algorithms. In computer vision, "segmentation" means the process of partitioning an image into multiple homogeneous regions. So with the use of segments with similar pixel intensities it is possible to simplify the representation of an image. Afterwards, features in the segments can be calculated. Through the last years, new segmentation algorithms have been developed. We investigated two superpixel algorithms, the SLIC Superpixel (Achanta u. a., 2010) and the Superpixel Contour Relaxation Algorithm (Mester u. a., 2011). Furthermore, we used the watershed segmentation which could provide good results in other studies (Li u. a. (1999), Vincent u. Soille (1991)). The next chapter is dedicated to preprocessing steps and the data set. In this thesis four TerraSAR-X scenes of the Kamen region in North Rhine- Westphalia, Germany, are classified. Multitemporal data is very useful to discriminate surface types with short temporal variation (Waske u. Braun, 2009). Thus, vegetation and especially agricultural areas can be well differentiated from urban areas, which show mostly long-term temporal changes. Furthermore, this chapter illustrates the annotation of training and test data for the Random Forest. A part of the TerraSAR-X scene was divided into the six classes (i) deep development, (ii) loose development, (iii) trade-/industrial building, (iv) traffic areas, and the vegetation classes, (v) fields and (vi) forest. Afterwards, the outcomes of this thesis are discussed. An adequate concept for the classification of TerraSAR-X data of Kamen could be developed. The Random Forest performed well in terms of a fast and efficient classification of large data sets. We chose 1000 training samples per class and 200 trees for the Random Forest model. It was shown that the Markov Random Fields (MRF) can be used to improve the Random Forest classification. The principle of Markov random fields is the combination of the a-posteriori probability of the class label with the assumption that homogeneous regions are more probable. Due to the creation of homogeneous regions by the Markov Random Fields, pixelwise classification failures were corrected and thus the overall result was improved. We used a graph cut algorithm to minimize the energy function. The classification accuracy of the TerraSAR- X data without any other features was 42%. The Markov Random Field segmentation could improve the classification accuracy up to 63%. The segmentation of the image in homogeneous regions rectifies pixelwise misclassification and the radar-specific speckle effect can partly be compensated. The poor results could be increased by the use of the gamma filter before classifying the TerraSAR-X data in the Random Forest. The classification overall accuracy increased to 59% and afterwards the Markov Random Field segmentation improved the accuracy to 73%. When investigating textural features for the classification, the co-occurrence measures outperformed the semivariograms and the textural features of histograms. Even with its best result with a window width of 27 x 27, the semivariograms could only reach an overall accuracy of 82%. The evaluation of the textural features showed differentiating results. The window size is an important parameter of the textural measures and it could be shown that larger rectangular environments lead to a better classification accuracy. However, consequences such as the loss of small details and the tendency to receive block-like structures in the subsequent classification have to be considered. The best results of the texture measures from histograms were reached with a window size of 21 x 21. The classification shows some block-wise regions of false labelling. The overall accuracy was 94.2%. Although it is a great improvement in comparison to the TerraSAR-X classification results, this outcome is not yet satisfying. Furthermore, this quite high accuracy should be reflected upon critically. The test data covers only some regions of the image and so in some areas in the picture, misclassifications can not be detected statistically. Furthermore, we classified co-occurrence measures with different window sizes between 7 x 7 and 35 x 35. The best overall accuracy was provided by the co-occurrence measures with a window width of 35 x 35 and speckle filtering before. The amount of trade-/industrial building and traffic areas on the misclassification was particularly high. When evaluating segmentation algorithms the Superpixel Contour Relaxation algorithm outperformed the other segmentation procedures. Due to the oversegmentation created by the watershed algorithm, the classification accuracy only reached 85%. To achieve more homogeneous regions, a merging of the oversegmented regions could be taken into account. The SLIC superpixel algorithm could not improve the overall accuracy in comparison to the other procedures. The best result was achieved by a 3-level segmentation which consists of the initial grid-sizes 5 x 5, 10 x 10 and 50 x 50. In doing so, the Random Forest classification accuracy was 73%, 90% and 89%, respectively, for the three segmentation levels. The classification of the three segmentations together outperformed the single segment classifications with an overall accuracy of 95.3%. Furthermore, the comparison of the multilevel Superpixel Contour segmentation with the segmentation of the commercial software eCognition showed that we receive similar results. The benefit of our segmentation is that we do not need manual input in contrast to the multiresolution segmentation by eCognition. The combination of each of the best performing features described above provided the best overall accuracy on basis of the TerraSAR-X data. To sum it up, the best features were the co-occurrence measures, the multilevel Superpixel Contour segmentation and Markov Random Field segmentation after the Random Forest classification. Moreover, the Random Forest proved to be an ideal classifier for multisensor data concerning TerraSAR-X and Rapideye data. The sensor fusion in the Random Forest allows the use of complementary information from both systems and thus an improvement of the classification success. For example SAR specific effects like radar shadow or layover can be compensated by additional optical data. This can be observed for instance at the east sides of the forests in Kamen region which exhibit an information gap because of radar shadows. The overall accuracy could be improved to 98.9% by the best TerraSAR-X based features with additional optical data. The classification image showed very little misclassifications in visual comparison with airborne optical data. A confusion matrix was calculated to further evaluate the class-specific accuracies. The producer accuracy of each class reached over 96%. So a high proportion of the reference data was classified correctly. Moreover, the user accuracy showed similar results apart from the deep development (78.8%) and the traffic areas (90.9%). This phenomenon was also observed in the previous classifications. It can be explained as follows: The definition of deep development includes a high sealing level of nearly 100% and the loose development has a large amount of vegetation and non man-made objects. So in some cases, the buildings of the loose development are misclassified as deep development while the rest is classified correctly. Among other things, this leads to a deep development user accuracy of 78.8%. The Cohen's kappa coefficient which gives an assessment for the overall accuracy was 0.97. As a result, the described methods led to an "ideal concept" which shows the most accurate classification result. This includes the use of optical data in addition to TerraSAR-X data. Some improvements for further work could be the use of multipolarimetric SAR data or optical data with a higher resolution. The processing of optical data with the Superpixel Contour Relaxation algorithm or other means could be promising as well. Moreover, a separate street extraction algorithm could be used to improve the classification of the traffic areas and below the line a better overall result.
Weltweit ist eine steigende Urbanisierung und Suburbanisierung zu verzeichnen. Um die stetig wachsende Versiegelung untersuchen zu können, erweist es sich als vorteilhaft, dass die aktuellen Entwicklungen bei den Fernerkundungssensoren zu einer besseren räumlichen Auflösung beitragen. Dies ermöglicht eine zunehmend genauere Differenzierung urbaner Strukturen. In dieser Arbeit ist eine effiziente Strategie zur Klassifikation von hochaufgelösten TerraSAR-X Daten urbaner Räume erstellt und umgesetzt worden. Zu diesem Zweck wurden in den ersten bei den Kapiteln zunächst Grundlagen, Vorverarbeitungsschritte sowie die genutzten Daten vorgestellt. Im Grundlagenkapitel werden vor allem die Merkmale dargelegt, mit denen im Random Forest die Klassifikation durchgeführt wird. Dies sind zum einen die Texturmaße, die zu einem Informationszugewinn führen. Zum anderen konnte das Klassifikationsergebnis durch die Nutzung von Segmentierungsalgorithmen verbessert werden. Weiterhin zeigte sich, dass mit der Nutzung eines Speckle-Filters vor den Berechnungen der Texturmaße aus Co-Occurrence Matrizen das Gesamtergebnis optimiert werden konnte. Anschließend wurden im Auswertungskapitel Ergebnisse und daraus resultierende Erkenntnisse diskutiert. Es konnte ein adäquates Konzept zur Klassifikation der TerraSAR-X Daten der Region Kamen in Nordrhein- Westfalen entwickelt werden. Der Random Forest bewährte sich als schneller und effizienter Klassifikator von großen Datenmengen. Des Weiteren eignete sich der Random Forest ideal für eine Sensorfusion mit zusätzlichen optischen Daten der Rapideye Satelliten. Im Rahmen der Untersuchungen der Texturmaße zur Klassifikation urbaner Räume zeigte sich, dass Texturmaße aus Co-Occurrence-Matrizen gegenüber den Semivariogrammen und Texturmaßen aus Histogrammen am besten zum Klassifikationserfolg beitragen konnten. Die Fenstergröße ist ein wichtiger Parameter der Texturmaße und es zeigte sich, dass mit größeren Rechteckumgebungen zur Berechnung der Texturmaße i. d. R. bessere Ergebnisse erzielt werden konnten. Allerdings müssen die damit einhergehenden Folgen wie der Verlust von kleinen Details und die Tendenz zur Blockbildung bei der anschließenden Klassifikation beachtet werden. Zur Segmentierung der Radardaten sind verschiedene Verfahren untersucht worden. Dabei zeigte sich, dass das Klassifikationsergebnis auf Basis der Segmente des Superpixel Contour Relaxation Algorithmus die anderen Segmentierungsansätze übertrifft. Das beste Ergebnis erzielte dieser Algorithmus mit einer 3- Level-Segmentierung, welche unterschiedliche Segment größen umfasst. Darüber hinaus zeigte sich, dass die Markov Random Fields gut geeignet sind, um das Klassifikationsergebnis des Random Forest weiter zu verbessern. Auf Grund der Bildung homogener Regionen durch die Markov Random Fields wurden pixelweise Fehlklassifikationen korrigiert und das Gesamtbild verbessert. Aus den beschriebenen Verfahren wurde ein "ideales Konzept" erstellt, welches zum genauesten Klassifikationsergebnis führt. Dazu gehört neben den Berechnungen auf Basis der TerraSAR-X Daten auch die Nutzung optischer Daten. Durch die Sensorfusion im Random Forest können die Stärken bei der Sensorsysteme zur Steigerung des KIassifikationserfolgs genutzt werden.
Abstract
An increasing global urbanization and suburbanization can be observed. To monitor the growing sealing, it is advantageous that the recent developments in remote sensing improve spatial resolution. The advent of a new sensor generation offers a more precise differentiation of urban environments. Therefore, we can use different types of sensors (e.g., microwave, multispectral), each with different strengths and weaknesses. These sensors operate at different wavelengths and thus provide different information. In combination with Earth observation systems, global land cover information can be acquired rapidly. Synthetic Aperture Radar (SAR) is an active remote sensing technique highly sensitive to geometrical configurations and dielectric properties. SAR sensors are capable to receive microwaves independently from daytime and weather conditions. Hence, SAR satellites offer the advantage to play a key role in urban monitoring during time critical events like natural hazards (Sorgel, 2010). For example SAR data have been used for mitigation and damage assessment during flooding (Voigt u. a., 2005) and after the earthquake in Taiwan (Takeuchi u. a., 2000). Furthermore, this technology can provide gapless and full usable time series. There are many more applications, SAR data can be used for. The properties of microwaves allow for example to gather land cover information in tropical zones or to monitor glaciers or oil leaks (Sorgel, 2010). In this thesis, an efficient strategy for the classification of high resolution TerraSAR-X data (Werninghaus u. Buckreuss, 2010) covering urban areas has been developed and implemented. To achieve this, we use state of the art textural and segmentation procedures. The first chapter introduces some basics and focuses on the Random Forest (RF) (Breiman, 2001) classification and its features. The Random Forest is a supervised classifier, so a set of training data is, necessary. It is an ensemble classifier that consists of many decision trees. The output is a majority vote of all decision trees for a class. Random Forest is a fast and efficient algorithm capable to classify large amounts of multisensor data. To improve the classification accuracy, we use textural features which lead to an information gain (Dekker, 2003). Since the TerraSAR-X sensor is single band, texture measures are useful to gain additional information. The principle is that textural information of the neighbourhood of each pixel is calculated within a moving window. Over the years a great number of texture measures have been developed. In this thesis we investigated texture measures that have been proved for SAR data like histogram measures, grey-level co-occurrence measures and semivariograms (Dekker (2003), Haralick u. a. (1973), Carr u. de Miranda (1998), Dell' Acqua u. Gamba (2006)). SAR data has the noise-like characteristic of speckle. In this thesis we used the gamma filter with a window width of 7 x 7 to reduce the effect of speckle. It was shown that the use of speckle filters before calculating the textural measures from co-occurrence matrices optimized the overall accuracy. The classification accuracy could be further improved by the use of segmentation algorithms. In computer vision, "segmentation" means the process of partitioning an image into multiple homogeneous regions. So with the use of segments with similar pixel intensities it is possible to simplify the representation of an image. Afterwards, features in the segments can be calculated. Through the last years, new segmentation algorithms have been developed. We investigated two superpixel algorithms, the SLIC Superpixel (Achanta u. a., 2010) and the Superpixel Contour Relaxation Algorithm (Mester u. a., 2011). Furthermore, we used the watershed segmentation which could provide good results in other studies (Li u. a. (1999), Vincent u. Soille (1991)). The next chapter is dedicated to preprocessing steps and the data set. In this thesis four TerraSAR-X scenes of the Kamen region in North Rhine- Westphalia, Germany, are classified. Multitemporal data is very useful to discriminate surface types with short temporal variation (Waske u. Braun, 2009). Thus, vegetation and especially agricultural areas can be well differentiated from urban areas, which show mostly long-term temporal changes. Furthermore, this chapter illustrates the annotation of training and test data for the Random Forest. A part of the TerraSAR-X scene was divided into the six classes (i) deep development, (ii) loose development, (iii) trade-/industrial building, (iv) traffic areas, and the vegetation classes, (v) fields and (vi) forest. Afterwards, the outcomes of this thesis are discussed. An adequate concept for the classification of TerraSAR-X data of Kamen could be developed. The Random Forest performed well in terms of a fast and efficient classification of large data sets. We chose 1000 training samples per class and 200 trees for the Random Forest model. It was shown that the Markov Random Fields (MRF) can be used to improve the Random Forest classification. The principle of Markov random fields is the combination of the a-posteriori probability of the class label with the assumption that homogeneous regions are more probable. Due to the creation of homogeneous regions by the Markov Random Fields, pixelwise classification failures were corrected and thus the overall result was improved. We used a graph cut algorithm to minimize the energy function. The classification accuracy of the TerraSAR- X data without any other features was 42%. The Markov Random Field segmentation could improve the classification accuracy up to 63%. The segmentation of the image in homogeneous regions rectifies pixelwise misclassification and the radar-specific speckle effect can partly be compensated. The poor results could be increased by the use of the gamma filter before classifying the TerraSAR-X data in the Random Forest. The classification overall accuracy increased to 59% and afterwards the Markov Random Field segmentation improved the accuracy to 73%. When investigating textural features for the classification, the co-occurrence measures outperformed the semivariograms and the textural features of histograms. Even with its best result with a window width of 27 x 27, the semivariograms could only reach an overall accuracy of 82%. The evaluation of the textural features showed differentiating results. The window size is an important parameter of the textural measures and it could be shown that larger rectangular environments lead to a better classification accuracy. However, consequences such as the loss of small details and the tendency to receive block-like structures in the subsequent classification have to be considered. The best results of the texture measures from histograms were reached with a window size of 21 x 21. The classification shows some block-wise regions of false labelling. The overall accuracy was 94.2%. Although it is a great improvement in comparison to the TerraSAR-X classification results, this outcome is not yet satisfying. Furthermore, this quite high accuracy should be reflected upon critically. The test data covers only some regions of the image and so in some areas in the picture, misclassifications can not be detected statistically. Furthermore, we classified co-occurrence measures with different window sizes between 7 x 7 and 35 x 35. The best overall accuracy was provided by the co-occurrence measures with a window width of 35 x 35 and speckle filtering before. The amount of trade-/industrial building and traffic areas on the misclassification was particularly high. When evaluating segmentation algorithms the Superpixel Contour Relaxation algorithm outperformed the other segmentation procedures. Due to the oversegmentation created by the watershed algorithm, the classification accuracy only reached 85%. To achieve more homogeneous regions, a merging of the oversegmented regions could be taken into account. The SLIC superpixel algorithm could not improve the overall accuracy in comparison to the other procedures. The best result was achieved by a 3-level segmentation which consists of the initial grid-sizes 5 x 5, 10 x 10 and 50 x 50. In doing so, the Random Forest classification accuracy was 73%, 90% and 89%, respectively, for the three segmentation levels. The classification of the three segmentations together outperformed the single segment classifications with an overall accuracy of 95.3%. Furthermore, the comparison of the multilevel Superpixel Contour segmentation with the segmentation of the commercial software eCognition showed that we receive similar results. The benefit of our segmentation is that we do not need manual input in contrast to the multiresolution segmentation by eCognition. The combination of each of the best performing features described above provided the best overall accuracy on basis of the TerraSAR-X data. To sum it up, the best features were the co-occurrence measures, the multilevel Superpixel Contour segmentation and Markov Random Field segmentation after the Random Forest classification. Moreover, the Random Forest proved to be an ideal classifier for multisensor data concerning TerraSAR-X and Rapideye data. The sensor fusion in the Random Forest allows the use of complementary information from both systems and thus an improvement of the classification success. For example SAR specific effects like radar shadow or layover can be compensated by additional optical data. This can be observed for instance at the east sides of the forests in Kamen region which exhibit an information gap because of radar shadows. The overall accuracy could be improved to 98.9% by the best TerraSAR-X based features with additional optical data. The classification image showed very little misclassifications in visual comparison with airborne optical data. A confusion matrix was calculated to further evaluate the class-specific accuracies. The producer accuracy of each class reached over 96%. So a high proportion of the reference data was classified correctly. Moreover, the user accuracy showed similar results apart from the deep development (78.8%) and the traffic areas (90.9%). This phenomenon was also observed in the previous classifications. It can be explained as follows: The definition of deep development includes a high sealing level of nearly 100% and the loose development has a large amount of vegetation and non man-made objects. So in some cases, the buildings of the loose development are misclassified as deep development while the rest is classified correctly. Among other things, this leads to a deep development user accuracy of 78.8%. The Cohen's kappa coefficient which gives an assessment for the overall accuracy was 0.97. As a result, the described methods led to an "ideal concept" which shows the most accurate classification result. This includes the use of optical data in addition to TerraSAR-X data. Some improvements for further work could be the use of multipolarimetric SAR data or optical data with a higher resolution. The processing of optical data with the Superpixel Contour Relaxation algorithm or other means could be promising as well. Moreover, a separate street extraction algorithm could be used to improve the classification of the traffic areas and below the line a better overall result.
[ BibTex ]
@MASTERSTHESIS:{stefanski11:klassifikation,
author={Stefanski, Jan},
title={Klassifikation hochaufl\"{o}sender TerraSAR-X Daten urbaner R\"{a}ume},
school{Department of Photogrammetry, University of Bonn},
year={2011}
}
Uebbing, Bernd:
Untersuchung zur Nutzung wiederholter Strukturen für die 3D Rekonstruktion aus Einzelaufnahmen
Bachelorarbeit, Bonn 2011
Betreuung: Prof.Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. Susanne Wenzel [ Zusammenfassung ]
Zusammenfassung
Untersuchung zur Nutzung wiederholter Strukturen für die 3D- Rekonstruktion aus Einzelaufnahmen
Ziel dieser Arbeit ist die Ableitung von 3D-Informationen aus Einzelaufnahmen. Dazu werden identische, wiederholte Strukturen verwendet. Diese treten in von Menschenhand geschaffenen Objekten sehr häufig auf. Wir betrachten diese wiederholten Strukturen als mehrere Aufnahmen eines Objektes. Zunächst vereinfachen wir die Problemstellung, indem wir die 3D Rekonstruktion von Punkten und Linien auf eine 2D Rekonstruktion von Punkten reduzieren. Dazu werden 1D Kameras eingeführt. Die Zeilen und Spalten von Bildausschnitten wiederholter Objekte werden dabei als Aufnahmen von 1D Kameras betrachtet. Aufgrund der Rektifizierung der Bilder können wir das Vorliegen des Normalfalls annehmen. Durch Rekonstruktion und Verschneiden der Abbildungsstrahlen von korrespondierenden Punkten aus drei 1D Kameras werden 2D Profile rekonstruiert. Aus diesen lassen sich Tiefeninformationen und deren Genauigkeit ableiten. Durch Kombination mehrerer Profile in horizontaler und vertikaler Richtung lassen sich unter optimalen Bedingungen 3D Modelle der wiederholten Strukturen erstellen. Wir verfolgen diesen Ansatz auf zwei Wegen. Zunächst wird ein Simulationsprogramm behandelt, welches das entwickelte Konzept an einem Modell unter optimalen Bedingungen testet. Dabei wird zudem die Annahme der theoretischen Genauigkeit empirisch überprüft. In einem nächsten Schritt wird der Ansatz für die Anwendung auf echte Bilder übertragen. Dazu verwenden wir Aufnahmen von Gebäudefassaden, bei denen wir geometrisch identische Fenster als wiederholte Strukturen betrachten. Dabei spielen besonders Aspekte wie Kantenextraktion und eine korrekte Zuordnung korrespondierender Kanten eine Rolle. Letztendlich stellen wir fest, dass der von uns verfolgte Ansatz in der Theorie des Simulationsprogramms sehr gute Ergebnisse liefert. Es ist möglich 2D Profile mit einer relativen Tiefengenauigkeit von 0.04% bis 2%, je nach Annahme der theoretischen Genauigkeit, zu erstellen. Die Rekonstruktion der 3D Informationen des im Simulationsprogramm verwendeten Modells gelingt sehr gut. Die Anwendung auf echte Bilder liefert weniger gute Resultate. Durch Ungenauigkeiten in der Kantenextraktion und der Zuordnung am Rand der wiederholten Strukturen und einer zu geringen Tiefe der verwendeten Testobjekte sind die Ergebnisse nicht sehr akkurat und aussagekräftig. In der Regel werden nur horizontale 2D Profile erstellt, da meist nicht drei identische Fensterstrukturen übereinander liegen. Zudem spielen weitere Faktoren wie Lichteinfall, Verzeichnungen und Störobjekte in den von uns verwendeten Fenstern eine Rolle. Unser entwickeltes Verfahren lässt sich daher nur bedingt zur Rekonstruktion auf den von uns verwendeten Bildern benutzen.
Abstract
Analysis of using repeated Structures for 3D-reconstruction from single images
The goal of this work is the derivation of 3D-information from single images. Therefore identical repeated structures are used. These structures are common in man-made scenes. The repeated structures can be seen as multiple pictures of a single object. At first we simplify the problem by projecting it from 3D to 2D. Thus we introduce 1D cameras by taking the rows and columns of the image sections showing the repeated structures. By rectifying the image we can assume the normal case. By reconstructing and intersecting the projection rays of corresponding points from three 1D cameras 2D profiles of the repeated structure can be recovered. Using these profiles we can derive depth information and their uncertainty. By combining more than one profile in horizontal and vertical direction even a 3D model of the repeated structure can be recovered. We pursue this approach in two ways. First we discuss a simulation program which applies the developed concept under optimal circumstances. Furthermore we verify our estimate of the theoretical uncertainty by performing an empirical test. Second we test our approach on real images. Therefore we use images of building facades in which we use geometrically identical windows as repeated objects. In this process edge-feature extraction and matching of these features plays a major role with real images. We examine our results and conclude that our approach performs very well in the theoretical environment of the simulation program. There it is possible to create 2D profiles with a relative uncertainty of depth of 0.04% to 2%, depending on the assumption of the theoretical uncertainty. Also the reconstruction of 3D information of the used model in the simulation performs very well. The results on real images lack in completeness and precision caused by uncertainties during the edgefeature extraction and the following matching of the 1D edgepoints. The results are not very reliable and meaningful. This is mostly due to the relatively small depth of the repeated structures. Mostly, just horizontal 2D profiles can be recovered, because there are not three identical windows on top of each other. Other major sources of uncertainties are incidences of light, radial image distortions and disturbing objects behind the windows or reflections of objects. Our approach is therefore only of limited use on the images used by us. To produce good results with our approach we require certain circumstances like a high resolution image, so the repeated structures are also displayed in a high resolution. Furthermore the repeated objects should have a certain amount of depth, so the parallax is significant.
Untersuchung zur Nutzung wiederholter Strukturen für die 3D- Rekonstruktion aus Einzelaufnahmen
Ziel dieser Arbeit ist die Ableitung von 3D-Informationen aus Einzelaufnahmen. Dazu werden identische, wiederholte Strukturen verwendet. Diese treten in von Menschenhand geschaffenen Objekten sehr häufig auf. Wir betrachten diese wiederholten Strukturen als mehrere Aufnahmen eines Objektes. Zunächst vereinfachen wir die Problemstellung, indem wir die 3D Rekonstruktion von Punkten und Linien auf eine 2D Rekonstruktion von Punkten reduzieren. Dazu werden 1D Kameras eingeführt. Die Zeilen und Spalten von Bildausschnitten wiederholter Objekte werden dabei als Aufnahmen von 1D Kameras betrachtet. Aufgrund der Rektifizierung der Bilder können wir das Vorliegen des Normalfalls annehmen. Durch Rekonstruktion und Verschneiden der Abbildungsstrahlen von korrespondierenden Punkten aus drei 1D Kameras werden 2D Profile rekonstruiert. Aus diesen lassen sich Tiefeninformationen und deren Genauigkeit ableiten. Durch Kombination mehrerer Profile in horizontaler und vertikaler Richtung lassen sich unter optimalen Bedingungen 3D Modelle der wiederholten Strukturen erstellen. Wir verfolgen diesen Ansatz auf zwei Wegen. Zunächst wird ein Simulationsprogramm behandelt, welches das entwickelte Konzept an einem Modell unter optimalen Bedingungen testet. Dabei wird zudem die Annahme der theoretischen Genauigkeit empirisch überprüft. In einem nächsten Schritt wird der Ansatz für die Anwendung auf echte Bilder übertragen. Dazu verwenden wir Aufnahmen von Gebäudefassaden, bei denen wir geometrisch identische Fenster als wiederholte Strukturen betrachten. Dabei spielen besonders Aspekte wie Kantenextraktion und eine korrekte Zuordnung korrespondierender Kanten eine Rolle. Letztendlich stellen wir fest, dass der von uns verfolgte Ansatz in der Theorie des Simulationsprogramms sehr gute Ergebnisse liefert. Es ist möglich 2D Profile mit einer relativen Tiefengenauigkeit von 0.04% bis 2%, je nach Annahme der theoretischen Genauigkeit, zu erstellen. Die Rekonstruktion der 3D Informationen des im Simulationsprogramm verwendeten Modells gelingt sehr gut. Die Anwendung auf echte Bilder liefert weniger gute Resultate. Durch Ungenauigkeiten in der Kantenextraktion und der Zuordnung am Rand der wiederholten Strukturen und einer zu geringen Tiefe der verwendeten Testobjekte sind die Ergebnisse nicht sehr akkurat und aussagekräftig. In der Regel werden nur horizontale 2D Profile erstellt, da meist nicht drei identische Fensterstrukturen übereinander liegen. Zudem spielen weitere Faktoren wie Lichteinfall, Verzeichnungen und Störobjekte in den von uns verwendeten Fenstern eine Rolle. Unser entwickeltes Verfahren lässt sich daher nur bedingt zur Rekonstruktion auf den von uns verwendeten Bildern benutzen.
Abstract
Analysis of using repeated Structures for 3D-reconstruction from single images
The goal of this work is the derivation of 3D-information from single images. Therefore identical repeated structures are used. These structures are common in man-made scenes. The repeated structures can be seen as multiple pictures of a single object. At first we simplify the problem by projecting it from 3D to 2D. Thus we introduce 1D cameras by taking the rows and columns of the image sections showing the repeated structures. By rectifying the image we can assume the normal case. By reconstructing and intersecting the projection rays of corresponding points from three 1D cameras 2D profiles of the repeated structure can be recovered. Using these profiles we can derive depth information and their uncertainty. By combining more than one profile in horizontal and vertical direction even a 3D model of the repeated structure can be recovered. We pursue this approach in two ways. First we discuss a simulation program which applies the developed concept under optimal circumstances. Furthermore we verify our estimate of the theoretical uncertainty by performing an empirical test. Second we test our approach on real images. Therefore we use images of building facades in which we use geometrically identical windows as repeated objects. In this process edge-feature extraction and matching of these features plays a major role with real images. We examine our results and conclude that our approach performs very well in the theoretical environment of the simulation program. There it is possible to create 2D profiles with a relative uncertainty of depth of 0.04% to 2%, depending on the assumption of the theoretical uncertainty. Also the reconstruction of 3D information of the used model in the simulation performs very well. The results on real images lack in completeness and precision caused by uncertainties during the edgefeature extraction and the following matching of the 1D edgepoints. The results are not very reliable and meaningful. This is mostly due to the relatively small depth of the repeated structures. Mostly, just horizontal 2D profiles can be recovered, because there are not three identical windows on top of each other. Other major sources of uncertainties are incidences of light, radial image distortions and disturbing objects behind the windows or reflections of objects. Our approach is therefore only of limited use on the images used by us. To produce good results with our approach we require certain circumstances like a high resolution image, so the repeated structures are also displayed in a high resolution. Furthermore the repeated objects should have a certain amount of depth, so the parallax is significant.
[ BibTex ]
@MASTERSTHESIS{uebbing11:untersuchung,
title={Untersuchung zur Nutzung wiederholter Strukturen für die 3D Rekonstruktion aus Einzelaufnahmen},
year={2011},
school={Institute of Photogrammetry, University of Bonn},
type={bachelor thesis},
}
Volkmann, Thorsten:
Vergleich von unterschiedlichen Verfahren der Merkmalsselektion und -Reduktion für die Analyse von hyperspektralen Fernerkundungsdaten
Masterarbeit, Bonn 2011
Betreuung: Prof. Dr. Björn Waske, Dipl.-Ing. Ribana Roscher [ Zusammenfassung ]
Zusammenfassung
Hyperspektrale Fernerkundungsdaten werden häufig zur Klassifikation von Landnutzungsklassen verwendet um quantitative Informationen über Vegetation, Boden und Umweltbeschaffenheit abzuleiten. Die Vielzahl an Informationen, bestehend aus den vielen Bändern der hyperspektralen Daten, hat jedoch auch einen Nachteil. Viele der traditionell verwendeten statistischen Klassifikationsmethoden, wie der Maximum Likelihood Klassifikator gelangen hinsichtlich der Leistungsfähigkeit bei der Menge an Merkmalen an ihre Grenze. Diese Tatsache verlangt alternative Methoden, zum Beispiel eine Selektion der Merkmale, um die Menge an Merkmalen zu reduzieren. Die Anzahl der Merkmale ist maßgeblich am Erfolg des Ergebnisses beteiligt und die Verwendung einer hohen Merkmalszahl führt nicht zwangsläufig zu einem besseren Ergebnis, da einige dieser Merkmale unter Umständen irrelevant für die Prädiktion der Klassen sind Die verschiedenen Methoden der Merkmalsselektion können in drei Kategorien unterteilt werden, abhängig davon wie sie mit dem Klassifikator agieren: (1) Filter, (2) Wrapper und (3) "embedded approaches" . Filteransätze operieren direkt auf dem Datensatz und sind daher unabhängig von einem Klassifikator . Sie werden in der Regel als Vorverarbeitungsschritt vor den eigentlichen Klassifikator geschaltet und liefern eine Gewichtung oder ein "Ranking" der Merkmale in Abhängigkeit ihrer Bedeutung für die Klassifikation. Bei dem Wrapperansatz umhüllt der Merkmalsselektionsalgorithmus den Klassifikator. Die Aufgabe des Wrappers ist es das beste Merkmalssubset aus einer Menge an Merkmalen zu bestimmen. Zu diesem Zweck führt der Wrapperansatz eine Suche im Merkmalsraum durch. Die "embedded" Ansätze verwenden interne Informationen des Klassifikators, um ein "Ranking" der Merkmale zu erreichen. Häufig bieten diese Ansätze eine Alternative zu den laufzeitintensiven aber genaueren Wrappern und den schnelleren aber ungenaueren Filtern. Ziel dieser Arbeit ist es verschiedene Verfahren zur Merkmalsselektion umzusetzen und deren Einflüsse auf die Modellgüte verschiedener Klassifikationsverfahren (Random Forest und Support Vector Machines) zu untersuchen . Hierfür werden verschiedene Ansätze der Merkmalsselektion wie beispielsweise der auf gemeinsamen Informationen basierende mRMR-Filter oder ein "Forward-Search" Wrapper auf zwei verschiedenen Datensätzen getestet. Aber auch Verfahren die klassifikatorspezifische Informationen wie die „Variable Importance" des Random Forest nutzen oder der SVM-RFE-Algorithmus, der mit dem Gewichtsvektor des SVM-Modells arbeitet, werden untersucht. Darüber hinaus wurden die Ergebnisse der Filter mit einem Wrapper zu einem zweistufigen Merkmalsselektionsalgorithmus kombiniert und deren Einfluss auf die Güte der Ergebnisse evaluiert. Die Ergebnisse der Untersuchungen zeigen, dass sich alle getesteten Selektionsverfahren für die Merkmalsselektion zur Klassifikation von hyperspektralen Fernerkundungsdaten eignen. Die Gesamtheit der Verfahren bewirkten eine signifikante Verbesserung in der Klassifikationsgenauigkeit unabhängig von der Anzahl der verwendeten Trainingsdaten oder des Klassifikators. Der SVM-RFE Filter liefert ohne eine weitere Nachbearbeitung durch einen Wrapper zufriedenstellende Ergebnisse, wohingegen bei den anderen Verfahren eine Kombination mit dem Wrapper durchaus sinnvoll erscheint.
Abstract
In this work the performance of several selection methods for feature selection for classification of hyperspectral remote sensing data was investigated. Hyperspectral remote sensing data are often used for classification of land use classes to include quantitative information on vegetation, soil and environmental quality to derive. The wealth of information, consisting of many bands of hyperspectral data, has one drawback. Many of the traditionally used statistical classification methods, such as the maximum likelihood classifier reach in terms of performance, in the amount of features to its limit. This fact calls for alternative methods such as a selection of features to reduce the amount of features. The number of features is instrumental in the success of the outcome and the use of a high number of features does not necessarily lead to a better result. This is due to the fact that the adjacent bands are highly correlated and therefore contain redundant information. Thus, some of these features may not be relevant to the prediction of the classes. The purpose of this paper is therefore to develop methods that are able to extract the important features that describe the relevant properties of the complete data set, to thereby achieve a better classification result. The feature selection problem is to move from an M-dimensional observation space to a subspace of m features, which describes the optimal target classes. It should be noted that the best m individual features do not necessarily represent the best combination of m features. In contrast to the feature extraction process, where the original data set is typically transformed from a high to a lower dimension, remains unchanged in the feature selection of the original data set. As a classification algorithm, the Random Forest and Support Vector Machines are used in this work. Both were also used for other works for classification of hyperspectral remote sensing data and have proven to be quite suitable. The principle of SVMs for a non-linear case is based on the generation of a hyperplane in the multidimensional space by a kernel function. Each sample of the training data set is here represented as a vector in the vector space. This approach allows you to convert the nonlinear problem into a linear case and to separate two classes by a linear hyperplane. Maximizing the margin between support vectors and the hyperplane is the optimization step. This ensures a reliable classification of objects that do not correspond exactly to the training data. The Random Forest classifier consists of a combination of several decision trees which is a similar but improved method over the bagging method. Each decision tree is trained with.a random subset of training samples, called "inbag" data, whereas the other part of the training samples, the "out-of-Bag" data are used to test the created model. This makes it possible to predict the accuracy of the classifier in advance. The final classification result is determined by a simple majority decision of the trees. By limiting the number of features at each node, by an user defined parameter, the computational complexity of the individual decision trees is reduced. This allows the RF to work with high-dimensional data. In the course of this work investigated methods of feature selection are generally divided into three categories, depending on how they interact with the classifier: (1) filter, (2) Wrapper and (3) embedded approaches. Filter approaches operates directly on the record and are therefore independent of a classifier. They appear usually as a preprocessing step before the actual classifier and provide a weight or a ranking of features depending on their importance for classification. The here tested mRMR (minimal-redundancy-maximum-relevance) algorithm uses mutual information to determine the dependency between features. The mRMR criterion for the selection of features is as follows: features will be sought that differ from each other, so that they have the least redundant information ("minimal redundancy") and still have the greatest relevance to a target class ("maximum relevance"). The result is a sorted list of importance to all features. As a wrapper approach a wrapper with a sequential forward search on the two data sets were used. This proceeds according to the "bottom-up" search strategy and identified the best feature subset by adding a feature to the current subset. As an evaluation criterion in this case, the estimated accuracy of the classifier was used. The embedded approaches, based on information of the classifier, also try a ranking of features to create. These approaches often offer an alternative to the run time-consuming but more accurate wrapper and the faster but less accurate filters. In this work the variable importance is generated, by examining the out-of-bag data of the Random Forest and the SVM-RFE algorithm was used, which makes use of the weight vector of the SVM model utilized. The SVM-RFE algorithm used the objective function ½||(w)||2 as the ranking criterion to obtain a sorted list of features. Furthermore the possibility was tested, to calculate the variable Importance of several random forests instead of determine the variable Importance of a single Random Forest. Therefore the importance-scores of the features of all Random Forests were averaged and then sorted according to their value. Moreover, the results of the filter with a wrapper were combined for a two-stage feature selection algorithm to achieve better classification results. In the first step of this two-stage process the classification accuracy of the by filter sorted features is used to find the so called candidate feature set. The second step involves additional, somewhat run-time intensive, working with the wrapper. At this step the candidate feature set is reduced by other features to become a compact feature subset in the hope that this improves the accuracy. In this work, the selection procedures were tested on two different data sets. One shows the University of the Italian city of Pavia, the other is a simulated data set that was created to prepare for the German EnMAP mission. These two records contain 103 or 122 channels and each with nine land use classes. To obtain a possible difference in the selection process to be evaluated depending on the number of training samples, multiple training data sets were created with different sizes. These include 15, 25, 50 and 100 randomly selected pixels in each class. Thus, each class is equally often included in the data an equalized random sampling method was used. The results of the investigations have shown that all tested selection procedures for feature selection for classification of hyperspectral remote sensing data are suitable. The totality of the process resulted in a significant improvement in classification accuracy regardless of the number of training data used or the classifier. The SVM-RFE filter supplies without an additional postprocessing step by a wrapper satisfactory results, whereas with the other methods, a combination with the wrapper is to consider.
Hyperspektrale Fernerkundungsdaten werden häufig zur Klassifikation von Landnutzungsklassen verwendet um quantitative Informationen über Vegetation, Boden und Umweltbeschaffenheit abzuleiten. Die Vielzahl an Informationen, bestehend aus den vielen Bändern der hyperspektralen Daten, hat jedoch auch einen Nachteil. Viele der traditionell verwendeten statistischen Klassifikationsmethoden, wie der Maximum Likelihood Klassifikator gelangen hinsichtlich der Leistungsfähigkeit bei der Menge an Merkmalen an ihre Grenze. Diese Tatsache verlangt alternative Methoden, zum Beispiel eine Selektion der Merkmale, um die Menge an Merkmalen zu reduzieren. Die Anzahl der Merkmale ist maßgeblich am Erfolg des Ergebnisses beteiligt und die Verwendung einer hohen Merkmalszahl führt nicht zwangsläufig zu einem besseren Ergebnis, da einige dieser Merkmale unter Umständen irrelevant für die Prädiktion der Klassen sind Die verschiedenen Methoden der Merkmalsselektion können in drei Kategorien unterteilt werden, abhängig davon wie sie mit dem Klassifikator agieren: (1) Filter, (2) Wrapper und (3) "embedded approaches" . Filteransätze operieren direkt auf dem Datensatz und sind daher unabhängig von einem Klassifikator . Sie werden in der Regel als Vorverarbeitungsschritt vor den eigentlichen Klassifikator geschaltet und liefern eine Gewichtung oder ein "Ranking" der Merkmale in Abhängigkeit ihrer Bedeutung für die Klassifikation. Bei dem Wrapperansatz umhüllt der Merkmalsselektionsalgorithmus den Klassifikator. Die Aufgabe des Wrappers ist es das beste Merkmalssubset aus einer Menge an Merkmalen zu bestimmen. Zu diesem Zweck führt der Wrapperansatz eine Suche im Merkmalsraum durch. Die "embedded" Ansätze verwenden interne Informationen des Klassifikators, um ein "Ranking" der Merkmale zu erreichen. Häufig bieten diese Ansätze eine Alternative zu den laufzeitintensiven aber genaueren Wrappern und den schnelleren aber ungenaueren Filtern. Ziel dieser Arbeit ist es verschiedene Verfahren zur Merkmalsselektion umzusetzen und deren Einflüsse auf die Modellgüte verschiedener Klassifikationsverfahren (Random Forest und Support Vector Machines) zu untersuchen . Hierfür werden verschiedene Ansätze der Merkmalsselektion wie beispielsweise der auf gemeinsamen Informationen basierende mRMR-Filter oder ein "Forward-Search" Wrapper auf zwei verschiedenen Datensätzen getestet. Aber auch Verfahren die klassifikatorspezifische Informationen wie die „Variable Importance" des Random Forest nutzen oder der SVM-RFE-Algorithmus, der mit dem Gewichtsvektor des SVM-Modells arbeitet, werden untersucht. Darüber hinaus wurden die Ergebnisse der Filter mit einem Wrapper zu einem zweistufigen Merkmalsselektionsalgorithmus kombiniert und deren Einfluss auf die Güte der Ergebnisse evaluiert. Die Ergebnisse der Untersuchungen zeigen, dass sich alle getesteten Selektionsverfahren für die Merkmalsselektion zur Klassifikation von hyperspektralen Fernerkundungsdaten eignen. Die Gesamtheit der Verfahren bewirkten eine signifikante Verbesserung in der Klassifikationsgenauigkeit unabhängig von der Anzahl der verwendeten Trainingsdaten oder des Klassifikators. Der SVM-RFE Filter liefert ohne eine weitere Nachbearbeitung durch einen Wrapper zufriedenstellende Ergebnisse, wohingegen bei den anderen Verfahren eine Kombination mit dem Wrapper durchaus sinnvoll erscheint.
Abstract
In this work the performance of several selection methods for feature selection for classification of hyperspectral remote sensing data was investigated. Hyperspectral remote sensing data are often used for classification of land use classes to include quantitative information on vegetation, soil and environmental quality to derive. The wealth of information, consisting of many bands of hyperspectral data, has one drawback. Many of the traditionally used statistical classification methods, such as the maximum likelihood classifier reach in terms of performance, in the amount of features to its limit. This fact calls for alternative methods such as a selection of features to reduce the amount of features. The number of features is instrumental in the success of the outcome and the use of a high number of features does not necessarily lead to a better result. This is due to the fact that the adjacent bands are highly correlated and therefore contain redundant information. Thus, some of these features may not be relevant to the prediction of the classes. The purpose of this paper is therefore to develop methods that are able to extract the important features that describe the relevant properties of the complete data set, to thereby achieve a better classification result. The feature selection problem is to move from an M-dimensional observation space to a subspace of m features, which describes the optimal target classes. It should be noted that the best m individual features do not necessarily represent the best combination of m features. In contrast to the feature extraction process, where the original data set is typically transformed from a high to a lower dimension, remains unchanged in the feature selection of the original data set. As a classification algorithm, the Random Forest and Support Vector Machines are used in this work. Both were also used for other works for classification of hyperspectral remote sensing data and have proven to be quite suitable. The principle of SVMs for a non-linear case is based on the generation of a hyperplane in the multidimensional space by a kernel function. Each sample of the training data set is here represented as a vector in the vector space. This approach allows you to convert the nonlinear problem into a linear case and to separate two classes by a linear hyperplane. Maximizing the margin between support vectors and the hyperplane is the optimization step. This ensures a reliable classification of objects that do not correspond exactly to the training data. The Random Forest classifier consists of a combination of several decision trees which is a similar but improved method over the bagging method. Each decision tree is trained with.a random subset of training samples, called "inbag" data, whereas the other part of the training samples, the "out-of-Bag" data are used to test the created model. This makes it possible to predict the accuracy of the classifier in advance. The final classification result is determined by a simple majority decision of the trees. By limiting the number of features at each node, by an user defined parameter, the computational complexity of the individual decision trees is reduced. This allows the RF to work with high-dimensional data. In the course of this work investigated methods of feature selection are generally divided into three categories, depending on how they interact with the classifier: (1) filter, (2) Wrapper and (3) embedded approaches. Filter approaches operates directly on the record and are therefore independent of a classifier. They appear usually as a preprocessing step before the actual classifier and provide a weight or a ranking of features depending on their importance for classification. The here tested mRMR (minimal-redundancy-maximum-relevance) algorithm uses mutual information to determine the dependency between features. The mRMR criterion for the selection of features is as follows: features will be sought that differ from each other, so that they have the least redundant information ("minimal redundancy") and still have the greatest relevance to a target class ("maximum relevance"). The result is a sorted list of importance to all features. As a wrapper approach a wrapper with a sequential forward search on the two data sets were used. This proceeds according to the "bottom-up" search strategy and identified the best feature subset by adding a feature to the current subset. As an evaluation criterion in this case, the estimated accuracy of the classifier was used. The embedded approaches, based on information of the classifier, also try a ranking of features to create. These approaches often offer an alternative to the run time-consuming but more accurate wrapper and the faster but less accurate filters. In this work the variable importance is generated, by examining the out-of-bag data of the Random Forest and the SVM-RFE algorithm was used, which makes use of the weight vector of the SVM model utilized. The SVM-RFE algorithm used the objective function ½||(w)||2 as the ranking criterion to obtain a sorted list of features. Furthermore the possibility was tested, to calculate the variable Importance of several random forests instead of determine the variable Importance of a single Random Forest. Therefore the importance-scores of the features of all Random Forests were averaged and then sorted according to their value. Moreover, the results of the filter with a wrapper were combined for a two-stage feature selection algorithm to achieve better classification results. In the first step of this two-stage process the classification accuracy of the by filter sorted features is used to find the so called candidate feature set. The second step involves additional, somewhat run-time intensive, working with the wrapper. At this step the candidate feature set is reduced by other features to become a compact feature subset in the hope that this improves the accuracy. In this work, the selection procedures were tested on two different data sets. One shows the University of the Italian city of Pavia, the other is a simulated data set that was created to prepare for the German EnMAP mission. These two records contain 103 or 122 channels and each with nine land use classes. To obtain a possible difference in the selection process to be evaluated depending on the number of training samples, multiple training data sets were created with different sizes. These include 15, 25, 50 and 100 randomly selected pixels in each class. Thus, each class is equally often included in the data an equalized random sampling method was used. The results of the investigations have shown that all tested selection procedures for feature selection for classification of hyperspectral remote sensing data are suitable. The totality of the process resulted in a significant improvement in classification accuracy regardless of the number of training data used or the classifier. The SVM-RFE filter supplies without an additional postprocessing step by a wrapper satisfactory results, whereas with the other methods, a combination with the wrapper is to consider.
Zimmermann, Florian:
Vergleich der beiden Programme Bundler und Aurelo zur automatischen Kameraorientierung
Bachelorarbeit, Bonn 2011
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. Falko Schindler download
3.6 M
[ Zusammenfassung ]
Zusammenfassung:
Die automatische Kameraorientierung dient der Berechnung der inneren und äußeren Orientierungsparameter einer oder mehrerer Kameras ohne vorherige Passpunktbestimmung und Angabe von Näherungswerten. Die Programme Bundler und Aurelo verwenden hierzu Bilder der jeweiligen Kamera und detektieren mit dem SIFT-Keypoint-Detektor Lowe-Punkte in den Bildern. Nach einer Zuordnung der Bilder anhand der detektierten Punkte berechnen beide Programme innerhalb einer Bündelblockausgleichung die Orientierungsparameter der Kameras und die 3D-Objektkoordinaten des aufgenommenen Objekts. Das Ziel dieser Arbeit besteht in einem Vergleich der beiden Programme. Neben einer Darstellung der Vor- und Nachteile soll sie auch als Entscheidungshilfe dienen, bei welchem zu Grunde liegenden Datensatz welches Programm am besten für die Kameraorientierung geeignet ist. Eine detaillierte Analyse der Programmabläufe zeigt, dass die wesentlichen Unterschiede in der Wahl des initialen Bildpaares, in der Näherungswertbestimmung für die Bündelausgleichung und in der Integration weiterer Bilder in den Berechnungsablauf liegen. Ein Schwerpunkt der Arbeit liegt auf der Untersuchung des Einflusses dieser Unterschiede auf die folgenden Aspekte. Die Präzision der Orientierung soll im Vergleich zu Sollwerten von online verfügbaren Benchmarks und geometrischen Forderungen aus Drehtelleraufnahmen geprüft werden. Benchmarks nutzen frei zugängliche Bilddaten im Internet und stellen Sollwerte für Kameraorientierung und 3D-Objektkoordinaten zur Verfügung. Zur Untersuchung der benötigten Rechenzeit und des Umgangs mit objektgeometrischen Spezialfällen generieren wir synthetische Testdaten. Hierzu geben wir die Orientierungsparameter der Kameras vor und übernehmen die Schritte der Merkmalsextraktion und der Zuordnung für die Programme. So können wir prinzipiell beliebig große Datensätze erzeugen und gezielt Spezialfälle simulieren. Ein Vergleich des Umgangs mit Amateuraufnahmen erfolgt mit eigenem Bildmaterial. Die Ergebnisse unserer Untersuchungen zeigen, dass Aurelo eine höhere Präzision der Kameraorientierung erreicht und somit für Anwendungen mit hohen Genauigkeitsanforderungen besser geeignet ist als Bundler. Bundler hingegen ist auf Grund der sehr geringen Laufzeit und der detaillierten Objektrekonstruktion die geeignete Wahl bei großen Datensätzen und Vorarbeiten für weiterführende Structure-from-Motion-Anwendungen.
Abstract:
Automatic camera orientation serves the computation of interior and exterior orientation parameters of one or several cameras without prior information about control points and approximate values. To do this, Bundler and Aurelo use images of the respective cameras and extract Lowe-Points using the SIFT-Keypoint-Detector. After matching all image pairs with the help of the detected points, both systems compute orientation parameters and 3D-coordinates for the objectpoints within a bundle block adjustment. The goal of this paper is to provide a comparison of the Bundler and Aurelo systems. As well as providing a representation of the advantages and disadvantages the paper should serve as a decision support aid, regarding the question of which system using which base dataset is most suitable for automatic camera orientation. A detailed analysis of the program flow shows that the main differences lie in the choice of the initial image pair, in the determination of approximate values for the bundle block adjustment and in the integration of additional images into the workflow. A main focus of this paper lies therefore on the analysis of the influence of these differences on several different aspects. The accuracy of the camera orientation will be checked in comparison to nominal values from online benchmarks and prescribed geometrical arrangements of a photography turntable. Benchmarks use freely accessible image datasets and provide nominal values for camera orientation and 3D-objectpoint coordinates. We will generate synthetic test datasets to analyse computing time and handling of special object geometry, for which we will simulate orientation parameters and undertake the tasks "feature extraction" and "image matching". Thus we will in principle be able to generate datasets of an arbitrary size and to simulate particular cases specifically. We will compare the handling of amateur pictures using our own images. The findings of our analyses show that Aurelo achieves higher precision in camera orientation and hence is more suitable for tasks with a high demand on accuracy than Bundler. Due to the low computing time and the more detailed object reconstruction Bundler is the more suitable choice for large datasets and preliminary work for continuative structure from motion tasks.
Die automatische Kameraorientierung dient der Berechnung der inneren und äußeren Orientierungsparameter einer oder mehrerer Kameras ohne vorherige Passpunktbestimmung und Angabe von Näherungswerten. Die Programme Bundler und Aurelo verwenden hierzu Bilder der jeweiligen Kamera und detektieren mit dem SIFT-Keypoint-Detektor Lowe-Punkte in den Bildern. Nach einer Zuordnung der Bilder anhand der detektierten Punkte berechnen beide Programme innerhalb einer Bündelblockausgleichung die Orientierungsparameter der Kameras und die 3D-Objektkoordinaten des aufgenommenen Objekts. Das Ziel dieser Arbeit besteht in einem Vergleich der beiden Programme. Neben einer Darstellung der Vor- und Nachteile soll sie auch als Entscheidungshilfe dienen, bei welchem zu Grunde liegenden Datensatz welches Programm am besten für die Kameraorientierung geeignet ist. Eine detaillierte Analyse der Programmabläufe zeigt, dass die wesentlichen Unterschiede in der Wahl des initialen Bildpaares, in der Näherungswertbestimmung für die Bündelausgleichung und in der Integration weiterer Bilder in den Berechnungsablauf liegen. Ein Schwerpunkt der Arbeit liegt auf der Untersuchung des Einflusses dieser Unterschiede auf die folgenden Aspekte. Die Präzision der Orientierung soll im Vergleich zu Sollwerten von online verfügbaren Benchmarks und geometrischen Forderungen aus Drehtelleraufnahmen geprüft werden. Benchmarks nutzen frei zugängliche Bilddaten im Internet und stellen Sollwerte für Kameraorientierung und 3D-Objektkoordinaten zur Verfügung. Zur Untersuchung der benötigten Rechenzeit und des Umgangs mit objektgeometrischen Spezialfällen generieren wir synthetische Testdaten. Hierzu geben wir die Orientierungsparameter der Kameras vor und übernehmen die Schritte der Merkmalsextraktion und der Zuordnung für die Programme. So können wir prinzipiell beliebig große Datensätze erzeugen und gezielt Spezialfälle simulieren. Ein Vergleich des Umgangs mit Amateuraufnahmen erfolgt mit eigenem Bildmaterial. Die Ergebnisse unserer Untersuchungen zeigen, dass Aurelo eine höhere Präzision der Kameraorientierung erreicht und somit für Anwendungen mit hohen Genauigkeitsanforderungen besser geeignet ist als Bundler. Bundler hingegen ist auf Grund der sehr geringen Laufzeit und der detaillierten Objektrekonstruktion die geeignete Wahl bei großen Datensätzen und Vorarbeiten für weiterführende Structure-from-Motion-Anwendungen.
Abstract:
Automatic camera orientation serves the computation of interior and exterior orientation parameters of one or several cameras without prior information about control points and approximate values. To do this, Bundler and Aurelo use images of the respective cameras and extract Lowe-Points using the SIFT-Keypoint-Detector. After matching all image pairs with the help of the detected points, both systems compute orientation parameters and 3D-coordinates for the objectpoints within a bundle block adjustment. The goal of this paper is to provide a comparison of the Bundler and Aurelo systems. As well as providing a representation of the advantages and disadvantages the paper should serve as a decision support aid, regarding the question of which system using which base dataset is most suitable for automatic camera orientation. A detailed analysis of the program flow shows that the main differences lie in the choice of the initial image pair, in the determination of approximate values for the bundle block adjustment and in the integration of additional images into the workflow. A main focus of this paper lies therefore on the analysis of the influence of these differences on several different aspects. The accuracy of the camera orientation will be checked in comparison to nominal values from online benchmarks and prescribed geometrical arrangements of a photography turntable. Benchmarks use freely accessible image datasets and provide nominal values for camera orientation and 3D-objectpoint coordinates. We will generate synthetic test datasets to analyse computing time and handling of special object geometry, for which we will simulate orientation parameters and undertake the tasks "feature extraction" and "image matching". Thus we will in principle be able to generate datasets of an arbitrary size and to simulate particular cases specifically. We will compare the handling of amateur pictures using our own images. The findings of our analyses show that Aurelo achieves higher precision in camera orientation and hence is more suitable for tasks with a high demand on accuracy than Bundler. Due to the low computing time and the more detailed object reconstruction Bundler is the more suitable choice for large datasets and preliminary work for continuative structure from motion tasks.
[ BibTex ]
@MASTERSTHESIS{zimmermann11:vergleich,
title={Vergleich der beiden Programme Bundler und Aurelo zur automatischen Kameraorientierung},
author={Zimmermann, Florian},
year={2011},
school={Institute of Photogrammetry, University of Bonn},
type={bachelor thesis},
}
2010
Albrecht, Markus:
Erkennung bewegter Objekte auf fluktuierendem Hintergrund in Bildfolgen
Masterarbeit, Bonn 2010
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. Ribana Roscher download
174 K
[ Zusammenfassung ]
Zusammenfassung im download
[ BibTex ]
@MASTERSTHESIS{albrecht10:erkennung,
author={Albrecht, Markus},
title ={Erkennung bewegter Objekte auf fluktuierendem
Hintergrund in Bildfolgen},
school={Institute of Photogrammetry, University of Bonn},
year = {2010},
city = {Bonn}
}
Hüsgen, Andreas:
Multi-Modal Segmentation of Anatomical and Functional Image of the Brain
Diplomarbeit, Bonn 2010
Betreuung: Prof. Dr.-Ing. W. Förstner, Privatdozent Dr. Volker Steinhage download
22 K
[ Zusammenfassung ]
Zusammenfassung im download
[ BibTex ]
@MASTERSTHESIS{huesgen10:multi-modal,
author={Andreas H\"{u}sgen},
title={{Multi-Modal Segmentation of Anatomical and Functional Image of the Brain}},
school={University of Bonn},
type={Diploma Thesis},
year={2010}
}
Hans, Mathias:
Die Verbesserung einer Bildsegmentierung unter Verwendung von 3D Merkmalen
Bachelorarbeit, Bonn 2010
Betreuung: Prof. Dr.-Ing Wolfgang Förstner, Dipl.-Ing. Ribana Roscher download
12.3 M
[ Zusammenfassung ]
Zusammenfassung
Ziel einer partionellen Bildsegmentierung ist die Einteilung eines Bildes in Regionen. Dabei wird jedes Pixel zu je einer Region zugeordnet. Liegen ungünstige Beleuchtungsverhältnisse im Bild vor, ist eine Segmentierung einzig basierend auf Bilddaten nicht ausreichend, da aneinandergrenzende Objekteile mit ähnlichen Farbwerten nicht unterschieden werden können. Mit Hilfe von 3D-Merkmalen können wir solche Bildsegmentierungen verbessern. Dabei liegt der Fokus der Arbeit auf segmentierten Luftbildern mit Dachflächen. Mit der Annahme, dass sich die Dächer aus Flächen erster Ordnung zusammensetzen, werden in den vorsegmentierten Bildregionen zunächst zwei Ebenen in den zugeordneten Punkten einer 3D-Punktwolke geschätzt. Hierzu wird der random sample consensus (RANSAC, Fischler and Bolles (1981)) verwendet. Wir beschränken uns auf die Trennkante zweier Dachflächen, die in einem bekannten Winkel φ zueinander stehen und die gleiche Neigung haben. Die Berechnung der Ebenenparameter ist somit bereits mit vier geeigneten Punkten der Objektkoordinaten möglich. Mit den geschätzten Ebenen in der Punktwolke segmentierte Bildregion kann diese aufgesplittet werden. Hierzu wenden wir ein lineares diskriminatives Modell an, um eine lineare Kante als Trennung in der Bildsegmentierung einzeichnen zu können. Eine visuelle Evaluierung der Ergebnisse zeigt, dass die hier vorgestellten Verfahren eine Trennung der Dachregionen an einer sinnvollen Stelle ermöglichen. Dabei werden die Verfahren an Bildern mit unterschiedlichen Dachformen getestet. Die Leistungsfähigkeit der Verfahren hängt vor Allem von der Punktkonfiguration der von RANSAC ausgewählten Punkte ab. Diese Arbeit beschreibt uns somit Verfahren, die eine regionenbasierende Segmentierung von Dachflächen auf Luftbildern unter der Verwendung von 3D Merkmalen verbessern.
Ziel einer partionellen Bildsegmentierung ist die Einteilung eines Bildes in Regionen. Dabei wird jedes Pixel zu je einer Region zugeordnet. Liegen ungünstige Beleuchtungsverhältnisse im Bild vor, ist eine Segmentierung einzig basierend auf Bilddaten nicht ausreichend, da aneinandergrenzende Objekteile mit ähnlichen Farbwerten nicht unterschieden werden können. Mit Hilfe von 3D-Merkmalen können wir solche Bildsegmentierungen verbessern. Dabei liegt der Fokus der Arbeit auf segmentierten Luftbildern mit Dachflächen. Mit der Annahme, dass sich die Dächer aus Flächen erster Ordnung zusammensetzen, werden in den vorsegmentierten Bildregionen zunächst zwei Ebenen in den zugeordneten Punkten einer 3D-Punktwolke geschätzt. Hierzu wird der random sample consensus (RANSAC, Fischler and Bolles (1981)) verwendet. Wir beschränken uns auf die Trennkante zweier Dachflächen, die in einem bekannten Winkel φ zueinander stehen und die gleiche Neigung haben. Die Berechnung der Ebenenparameter ist somit bereits mit vier geeigneten Punkten der Objektkoordinaten möglich. Mit den geschätzten Ebenen in der Punktwolke segmentierte Bildregion kann diese aufgesplittet werden. Hierzu wenden wir ein lineares diskriminatives Modell an, um eine lineare Kante als Trennung in der Bildsegmentierung einzeichnen zu können. Eine visuelle Evaluierung der Ergebnisse zeigt, dass die hier vorgestellten Verfahren eine Trennung der Dachregionen an einer sinnvollen Stelle ermöglichen. Dabei werden die Verfahren an Bildern mit unterschiedlichen Dachformen getestet. Die Leistungsfähigkeit der Verfahren hängt vor Allem von der Punktkonfiguration der von RANSAC ausgewählten Punkte ab. Diese Arbeit beschreibt uns somit Verfahren, die eine regionenbasierende Segmentierung von Dachflächen auf Luftbildern unter der Verwendung von 3D Merkmalen verbessern.
[ BibTex ]
MASTERSTHESIS@{hans10:die verbesserung,
author="Hans, Mathias",
title="Die Verbesserung einer Bildsegmentierung unter Verwendung
von 3D Merkmalen",
school="Institute of Photogrammetry, University of Bonn",
type="bachelor thesis",
year="2010",
city="Bonn",}
Muffert, Maximilian:
Verwendung eines mosaikbasierten Kamerasystems zur Bestimmung von räumlichen Orientierungsänderungen von mobilen Objekten
Masterarbeit, Bonn 2010
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Prof. Dr.-Ing. Heiner Kuhlmann download
42 K
[ Zusammenfassung ]
Zusammenfassung im download
[ BibTex ]
@MASTERSTHESIS{muffert10:verwendung,
author ={Muffert, Maxilmilian},
title ={Verwendung eines mosaikbasierten Kamerasystems zur Bestimmung von räumlichen Orientierungsänderungen von mobilen Objekten},
school={Institute of Photogrammetry,University of Bonn},
year ={2010},
city ={Bonn},
}
Röder-Sorge, Marisa:
Konzeption und Anwendung von Entscheidungsnetzwerken im Städtebau
Diplomarbeit, Bonn 2010
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Prof. Dr.-Ing. Theo Kötter [ Zusammenfassung ]
Zusammenfassung:
In dieser Arbeit wird mit dem Programm Netica ein Entscheidungsnetzwerk aufgestellt, das für sechs Gebäude eines Wohnkomplexes in Leipzig-Grünau die optimalen Entscheidungen über deren zukünftige Entwicklung ermittelt. In das Netzwerk werden die Interessen der Mieter, der Stadtverwaltung und der Wohnungsunternehmen Grünaus mit einbezogen, wobei mit letzeren Interviews über die Gewichtung der Einflussfaktoren im Stadtumbau geführt wurden. Netica eignet sich nur mit Einschränkungen für die Modellierung und Entscheidungsfindung im Stadtumbau, da nicht mehr als sechs Gebäude modelliert werden können und, genau wie mit allen anderen Entscheidungsnetzwerkprogrammen, die Darstellung des Free-Rider-Problems nicht möglich ist.
In dieser Arbeit wird mit dem Programm Netica ein Entscheidungsnetzwerk aufgestellt, das für sechs Gebäude eines Wohnkomplexes in Leipzig-Grünau die optimalen Entscheidungen über deren zukünftige Entwicklung ermittelt. In das Netzwerk werden die Interessen der Mieter, der Stadtverwaltung und der Wohnungsunternehmen Grünaus mit einbezogen, wobei mit letzeren Interviews über die Gewichtung der Einflussfaktoren im Stadtumbau geführt wurden. Netica eignet sich nur mit Einschränkungen für die Modellierung und Entscheidungsfindung im Stadtumbau, da nicht mehr als sechs Gebäude modelliert werden können und, genau wie mit allen anderen Entscheidungsnetzwerkprogrammen, die Darstellung des Free-Rider-Problems nicht möglich ist.
[ BibTex ]
@MASTERSTHESIS{roeder-sorge10:konzeption,
author ="R{\"o}der-Sorge, Marisa",
title ="Konzeption und Anwendung von Entscheidungsnetzwerken
im Städtebau",
school="University of Bonn",
year ="2010",
type="Diploma Thesis",}
Walther, Björn:
Photogrammetrie in der Schule
Bachelorarbeit, Bonn 2010
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner / Dipl.-Inf. Sabine Bauer, [ Zusammenfassung ]
Zusammenfassung
Die Materie der Photogrammetrie kann einem gymnasialen Oberstufenschüler zugänglich gemacht werden. Speziell wird das Thema der Inversen Perspektive so aufbereitet, dass es in 6 Doppelstunden verstanden und in einfacher Weise angewendet werden kann. Das Messen in Bildern stellt eine wichtige Grundanwendung der Photogrammetrie dar. Den Schüler/innen wird nahe gebracht, welche Informationen aus einem einzelnen Bild zu entnehmen sind. Es ist somit möglich, Größen von Gegenständen und Personen mit Hilfe von Referenzen zu ermitteln, bis hin zur dreidimensionalen Darstellung von Objekten. Die Schüler werden an die Materie zunächst herangeführt. Es müssen Grundlagen der darstellenden Geometrie erarbeitet werden (Zentralperspektive, Fluchtpunkte, Fluchtlinien, etc.). Das Beispiel der Lochkamera ist ebenfalls hilfreich für das Verständnis der Zentralprojektion. Der geschichtliche Hintergrund der Entwicklung der Perspektive soll ebenfalls Interesse wecken. Die Inverse Perspektive wird mit Beispielen und Übungen belegt, in denen die Schüler/innen selber tätig werden und aus eigenen Fotos die Perspektive erhalten. Die Schüler/innen sollen durch einen lockeren Umgang mit der Materie Motivation entwickeln und gleichzeitig einen guten Einblick in das Thema erhalten. Homogene Koordinaten werden das Interesse ebenfalls steigern, da hier bewiesen werden kann, dass sich parallele Geraden im Raum schneiden können. Anhand von Beispielbildern und Berechnungen können Schüler an diese Idee herangeführt werden. Mit diesem Wissen lassen sich anschließend Messungen im Bild durchführen. Die Schüler/innen können in den gestellten Aufgaben nun das zuvor Gelernte anwenden, um z.B. die Problematik zu lösen, wie groß eine Person in einem Bild ist. In der- letzten aufgeführten Doppelstunde wird die tiefergehende Thematik der Homologie angesprochen. Hier wird mit dem Kurs zusammen versucht, die Bedeutung des Begriffes zu erarbeiten und Anwendungen zu diskutieren. Insgesamt wird mit der Bachelorarbeit versucht einen Anstoß zu geben, dass Schüler sich mit Begriffen und Thematiken der Photogrammetrie auseinander setzen und einen Einblick in gewisse Praktiken gewinnen, wie z.B. die Bildverarbeitung.
Abstract:
The bachelor thesis is concentrating on making the subject of photogrammetry accessible for pupils of the upper secondary school type. Especially the topic of the inverse perspective is prepared in a way that it can be taught and applied in a series of 6 block periods. The measuring of photographs is an important basic application of the subject photogrammetry. The pupils are given an understanding of what information can be extracted from a single photograph, e.g. calculating the heights of objects or persons with the help of references, as well as the three-dimensional construction of objects. For introducing the pupils to the subject the basic principles of descriptive geometry have to be repeated and worked out together (e.g. central perspective, vanishing points, vanishing lines). A helpful example for the understanding of the central projection is the pinhole camera. Some more interest can be aroused with the historic background of the development of the perspective. The topic of the Inverse Perspective will be taught with the help of examples/ paradigms and exercises in which the pupils are given the opportunity to take their own photos and to extract information from them. Through the casual acquaintance it is hoped that the pupils should gain some motivation as well as get a good overview of the subject. With the topic of homogeneous coordinates can be proven that parallel lines do intersect in space, which should also be of interest for the pupils. That subject can be brought close with the help of examples and calculations. By the use of their new acquired knowledge the pupils can now take measurements from the photograph e.g. to solve the task of determining the height of person in a photograph. In the last block period the subject of homology is approached. The meaning of the term should be worked out with the class as well as the discussion of its application. Altogether this bachelor thesis tries to increase the incentive for pupils to study the terms and subjects of photogrametry and to gain insight in some methods like image processing.
Die Materie der Photogrammetrie kann einem gymnasialen Oberstufenschüler zugänglich gemacht werden. Speziell wird das Thema der Inversen Perspektive so aufbereitet, dass es in 6 Doppelstunden verstanden und in einfacher Weise angewendet werden kann. Das Messen in Bildern stellt eine wichtige Grundanwendung der Photogrammetrie dar. Den Schüler/innen wird nahe gebracht, welche Informationen aus einem einzelnen Bild zu entnehmen sind. Es ist somit möglich, Größen von Gegenständen und Personen mit Hilfe von Referenzen zu ermitteln, bis hin zur dreidimensionalen Darstellung von Objekten. Die Schüler werden an die Materie zunächst herangeführt. Es müssen Grundlagen der darstellenden Geometrie erarbeitet werden (Zentralperspektive, Fluchtpunkte, Fluchtlinien, etc.). Das Beispiel der Lochkamera ist ebenfalls hilfreich für das Verständnis der Zentralprojektion. Der geschichtliche Hintergrund der Entwicklung der Perspektive soll ebenfalls Interesse wecken. Die Inverse Perspektive wird mit Beispielen und Übungen belegt, in denen die Schüler/innen selber tätig werden und aus eigenen Fotos die Perspektive erhalten. Die Schüler/innen sollen durch einen lockeren Umgang mit der Materie Motivation entwickeln und gleichzeitig einen guten Einblick in das Thema erhalten. Homogene Koordinaten werden das Interesse ebenfalls steigern, da hier bewiesen werden kann, dass sich parallele Geraden im Raum schneiden können. Anhand von Beispielbildern und Berechnungen können Schüler an diese Idee herangeführt werden. Mit diesem Wissen lassen sich anschließend Messungen im Bild durchführen. Die Schüler/innen können in den gestellten Aufgaben nun das zuvor Gelernte anwenden, um z.B. die Problematik zu lösen, wie groß eine Person in einem Bild ist. In der- letzten aufgeführten Doppelstunde wird die tiefergehende Thematik der Homologie angesprochen. Hier wird mit dem Kurs zusammen versucht, die Bedeutung des Begriffes zu erarbeiten und Anwendungen zu diskutieren. Insgesamt wird mit der Bachelorarbeit versucht einen Anstoß zu geben, dass Schüler sich mit Begriffen und Thematiken der Photogrammetrie auseinander setzen und einen Einblick in gewisse Praktiken gewinnen, wie z.B. die Bildverarbeitung.
Abstract:
The bachelor thesis is concentrating on making the subject of photogrammetry accessible for pupils of the upper secondary school type. Especially the topic of the inverse perspective is prepared in a way that it can be taught and applied in a series of 6 block periods. The measuring of photographs is an important basic application of the subject photogrammetry. The pupils are given an understanding of what information can be extracted from a single photograph, e.g. calculating the heights of objects or persons with the help of references, as well as the three-dimensional construction of objects. For introducing the pupils to the subject the basic principles of descriptive geometry have to be repeated and worked out together (e.g. central perspective, vanishing points, vanishing lines). A helpful example for the understanding of the central projection is the pinhole camera. Some more interest can be aroused with the historic background of the development of the perspective. The topic of the Inverse Perspective will be taught with the help of examples/ paradigms and exercises in which the pupils are given the opportunity to take their own photos and to extract information from them. Through the casual acquaintance it is hoped that the pupils should gain some motivation as well as get a good overview of the subject. With the topic of homogeneous coordinates can be proven that parallel lines do intersect in space, which should also be of interest for the pupils. That subject can be brought close with the help of examples and calculations. By the use of their new acquired knowledge the pupils can now take measurements from the photograph e.g. to solve the task of determining the height of person in a photograph. In the last block period the subject of homology is approached. The meaning of the term should be worked out with the class as well as the discussion of its application. Altogether this bachelor thesis tries to increase the incentive for pupils to study the terms and subjects of photogrametry and to gain insight in some methods like image processing.
[ BibTex ]
MASTERSTHESIS@{walther10:Photogrammetrie,
author={Walther, Bj{\"o}rn},
title={Photogrammetrie in der Schule},
school={Institute of Photogrammetry, University of Bonn},
year={2010},
type={Bachelor Thesis}
}
2009
Abendroth, Birgit / zur Mühlen, Miriam:
Genauigkeitsbeurteilung und Untersuchungen der Zuverlässigkeit von optischen Onlinemessungen
Diplomarbeit, 2009
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Inform. Timo Dickscheid, Dipl.-Ing. Robert Godding download
8.5 M
[ Zusammenfassung ]
Vorwort
Der Titel" Genauigkeitsbeurteilung und Untersuchungen der Zuverlässigkeit von optischen Onlinemessungen" impliziert eine weite Bandbreite an Untersuchungsmöglichkeiten. Diese allgemeine Einführung gibt einen Überblick über die untersuchten Aspekte dieser Arbeit. Neben der Motivation, die zu der Entstehung dieser Diplomarbeit geführt hat, beinhaltet diese Einführung eine grobe Gliederung der behandelten Themenschwerpunkte.
Motivation
Ein neues Aufgabengebiet innerhalb der Nahbereichsphotogrammetrie bietet die Konzeption von photogrammetrischen Messsystemen für industrielle Aufgabenstellungen. Die Firma AICON 3D Systems GmbH, mit deren Kooperation diese Arbeit entstand, hat sich auf die Entwicklung solcher Systeme spezialisiert. Sie gehört zu den weltweit führenden Unternehmen im Bereich der optischen kamerabasierten 3D-Vermessung. Ihr Anspruch ist es, hochgenaue und effiziente Produkte im Bereich von Inspektion und Prüfung zu entwickeln und zu überwachen. Ihre Produkte vertreibt das 1990 gegründete Unternehmen überwiegend in der Automobil-, Luft- und Raumfahrtindustrie sowie im Anlagen- und Schiffsbau. Zur Erfassung von dynamischen Vorgängen bietet das Unternehmen echtzeitfähige optische Messsysteme an, die je nach Konfiguration in der Lage sind einzelne signalisierte Punkte als 3D-Koordinaten zu erfassen oder die Bewegung eines Starrkörpers aufzunehmen. Damit diese photogrammetrischen Systeme gegenüber anderen Messsystemen im Konkurrenzkampf bestehen können, müssen sich diese einer ständigen Weiterentwicklung und Verbesserung unterziehen. Dabei steht insbesondere die Wirtschaftlichkeit, Zuverlässigkeit und die Genauigkeit der Systeme im Vordergrund. Außerdem ist es nötig einzelne Messsysteme zu charakterisieren, um sie vergleichbar zu machen und die Einsatzmöglichkeiten aufzuzeigen. Dazu gehört neben den oben genannten Kriterien der Genauigkeit, Zuverlässigkeit und Wirtschaftlichkeit auch das Spektrum der Einsatzmöglichkeiten mit systemspezifischen Rahmenbedingungen. Des Weiteren kann ein Vergleich über Hardware- und Software-Module geschehen. Im weiteren Verlauf dieser Arbeit werden die Eigenschaften der Genauigkeit und der Software-Module näher untersucht. Dabei zeigt eine Genauigkeitsuntersuchung die Grenzen der Messsysteme auf, deren Kenntnis für die Weiterentwicklung von Bedeutung ist. Für die Verbesserung der Software wird diese anhand ihrer vorhandenen Algorithmik untersucht und mit alternativen Berechnungverfahren verglichen. Als Ausgangspunkt für diese Untersuchungen dienen dabei die beiden Onlinemesssysteme WHEELWATCH und MoveINSPECT der Firma AICON 3D Systems GmbH. Die Motivation der Firma AICON 3D Systems GmbH ein Diplomarbeitsthema im Bereich einer Genauigkeitsuntersuchung zu stellen, liegt darin, das vorhandene theoretische 'Wissen der Universität mit dem praktischen Anwendungsbeispiel der Onlinemesssysteme zu verbinden. Dies gilt auch für den Bereich der Weiterentwicklung der Algorithmik. Damit die Systeme auch in Zukunft wettbewerbsfähig sind, müssen diese ständig weiter entwickelt werden. Aus diesem Grund beinhaltet diese Arbeit die Untersuchung von zwei verschiedenen Problemstellungen, die sich innerhalb der Algorithmen der Systeme ergeben.
Aufgabenstellung
Das Ziel dieser gesamten Diplomarbeit besteht in der Verbesserung und Weiterentwick¬lung von Onlinemesssystemen. Dabei sollen theoretische Verfahren, die an der Universität vermittelt werden, auf die speziellen Messsysteme WHEELWATCH und MOVEINSPECT der Firma AICON 3D Systems GmbH angepasst und modifiziert werden. Insbesonders geht es um drei Aspekte der Onlinemesssysteme. Als erstes soll eine Gnauigkeitsuntersuchung der Onlinemesssysteme in Hinblick auf die Bewegungserfassung von Starrkörpern durchgeführt werden. Hierbei dienen statistische Grundlagen dazu, die bisherigen Genauigkeitsangaben von AICON 3D Systems GmbH durch eine statistisch fundierte Angabe zu validieren. Die allgemeine Problemstellung bezieht sich auf die Entwicklung eines Testverfahrens für die Spezifikation von Genauigkeitsangaben der detektierten Bewegung von starren Objekten, die sich im Nahbereich des Messsystems befinden. Unter Nahbereich ist hier eine maximale Entfernung von bis zu 3m zu verstehen. Die nächsten zwei Teilaspekte bestehen in der Beurteilung der bestehenden Algorithmik und dessen Verbesserung durch alternative Lösungsansätze. Hier handelt es sich um zwei allgemeine Probleme. Für das Einkamerasystem werden direkte Lösungsmöglichkeiten des Räumlichen Rückwärtsschnittes aufgezeigt. Im Fall eines Zweikamerasystems findet eine Verbesserung der Punktzuordnung statt. Diese basiert insbesondere auf der Berücksichtigung der Oberfläche der Objekte. Diese Teilaufgaben werden in den einleitenden Abschnitten der drei Teile genau spezifiziert.
Aufbau der Arbeit
Diese Diplomarbeit befasst sich mit drei verschiedenen Aspekten der Onlinemesssyste¬me WHEELWATCH und MoveINSPECT. Aus diesem Grund besteht dieses Dokument aus drei großen Teilen. Der Teil I trägt den Titel "Genauigkeitsbeurteilung von optischen Onlinemesssystemen". Darunter befindet sich die Entwicklung von zwei Testverfahren, die speziell für die Systeme WHEELWATCH und MoveINSPECT konzipiert werden. Dabei beziehen sich die Testverfahren zur Untersuchung der Genauigkeit zum einen auf Strecken und zum anderen auf Winkel. Die genaue Vorgehensweise ist dem ersten Teil dieser Arbeit zu entnehmen. Die beiden folgenden Teile befassen sich mit der Verbesserung der Algorithmik der Onlinemesssysteme. Dabei stellt der Teil Il Alternativen zum Räumlicher Rückwärtsschnitt (RRS) des Systems WHEEL WATCH vor. Das Ziel dieses Abschnitts ist es das bisher von der Firma AICON 3D Systems GmbH implementierte iterative Verfahren des RRS durch ein direktes zu erweitern. Die direkte Lösung des RRS dient dann zur Bestimmung der Näherungswerte für das iterative Verfahren. Mit der Algorithmik des Systems MoveINSPECT befasst sich der Teil III. Hier werden neue Ansatzmöglichkeiten aufgezeigt, um das Problem der Zuordnung von uncodierten Marken bei einem Zweikamerasystem zu verringern.
Der Titel" Genauigkeitsbeurteilung und Untersuchungen der Zuverlässigkeit von optischen Onlinemessungen" impliziert eine weite Bandbreite an Untersuchungsmöglichkeiten. Diese allgemeine Einführung gibt einen Überblick über die untersuchten Aspekte dieser Arbeit. Neben der Motivation, die zu der Entstehung dieser Diplomarbeit geführt hat, beinhaltet diese Einführung eine grobe Gliederung der behandelten Themenschwerpunkte.
Motivation
Ein neues Aufgabengebiet innerhalb der Nahbereichsphotogrammetrie bietet die Konzeption von photogrammetrischen Messsystemen für industrielle Aufgabenstellungen. Die Firma AICON 3D Systems GmbH, mit deren Kooperation diese Arbeit entstand, hat sich auf die Entwicklung solcher Systeme spezialisiert. Sie gehört zu den weltweit führenden Unternehmen im Bereich der optischen kamerabasierten 3D-Vermessung. Ihr Anspruch ist es, hochgenaue und effiziente Produkte im Bereich von Inspektion und Prüfung zu entwickeln und zu überwachen. Ihre Produkte vertreibt das 1990 gegründete Unternehmen überwiegend in der Automobil-, Luft- und Raumfahrtindustrie sowie im Anlagen- und Schiffsbau. Zur Erfassung von dynamischen Vorgängen bietet das Unternehmen echtzeitfähige optische Messsysteme an, die je nach Konfiguration in der Lage sind einzelne signalisierte Punkte als 3D-Koordinaten zu erfassen oder die Bewegung eines Starrkörpers aufzunehmen. Damit diese photogrammetrischen Systeme gegenüber anderen Messsystemen im Konkurrenzkampf bestehen können, müssen sich diese einer ständigen Weiterentwicklung und Verbesserung unterziehen. Dabei steht insbesondere die Wirtschaftlichkeit, Zuverlässigkeit und die Genauigkeit der Systeme im Vordergrund. Außerdem ist es nötig einzelne Messsysteme zu charakterisieren, um sie vergleichbar zu machen und die Einsatzmöglichkeiten aufzuzeigen. Dazu gehört neben den oben genannten Kriterien der Genauigkeit, Zuverlässigkeit und Wirtschaftlichkeit auch das Spektrum der Einsatzmöglichkeiten mit systemspezifischen Rahmenbedingungen. Des Weiteren kann ein Vergleich über Hardware- und Software-Module geschehen. Im weiteren Verlauf dieser Arbeit werden die Eigenschaften der Genauigkeit und der Software-Module näher untersucht. Dabei zeigt eine Genauigkeitsuntersuchung die Grenzen der Messsysteme auf, deren Kenntnis für die Weiterentwicklung von Bedeutung ist. Für die Verbesserung der Software wird diese anhand ihrer vorhandenen Algorithmik untersucht und mit alternativen Berechnungverfahren verglichen. Als Ausgangspunkt für diese Untersuchungen dienen dabei die beiden Onlinemesssysteme WHEELWATCH und MoveINSPECT der Firma AICON 3D Systems GmbH. Die Motivation der Firma AICON 3D Systems GmbH ein Diplomarbeitsthema im Bereich einer Genauigkeitsuntersuchung zu stellen, liegt darin, das vorhandene theoretische 'Wissen der Universität mit dem praktischen Anwendungsbeispiel der Onlinemesssysteme zu verbinden. Dies gilt auch für den Bereich der Weiterentwicklung der Algorithmik. Damit die Systeme auch in Zukunft wettbewerbsfähig sind, müssen diese ständig weiter entwickelt werden. Aus diesem Grund beinhaltet diese Arbeit die Untersuchung von zwei verschiedenen Problemstellungen, die sich innerhalb der Algorithmen der Systeme ergeben.
Aufgabenstellung
Das Ziel dieser gesamten Diplomarbeit besteht in der Verbesserung und Weiterentwick¬lung von Onlinemesssystemen. Dabei sollen theoretische Verfahren, die an der Universität vermittelt werden, auf die speziellen Messsysteme WHEELWATCH und MOVEINSPECT der Firma AICON 3D Systems GmbH angepasst und modifiziert werden. Insbesonders geht es um drei Aspekte der Onlinemesssysteme. Als erstes soll eine Gnauigkeitsuntersuchung der Onlinemesssysteme in Hinblick auf die Bewegungserfassung von Starrkörpern durchgeführt werden. Hierbei dienen statistische Grundlagen dazu, die bisherigen Genauigkeitsangaben von AICON 3D Systems GmbH durch eine statistisch fundierte Angabe zu validieren. Die allgemeine Problemstellung bezieht sich auf die Entwicklung eines Testverfahrens für die Spezifikation von Genauigkeitsangaben der detektierten Bewegung von starren Objekten, die sich im Nahbereich des Messsystems befinden. Unter Nahbereich ist hier eine maximale Entfernung von bis zu 3m zu verstehen. Die nächsten zwei Teilaspekte bestehen in der Beurteilung der bestehenden Algorithmik und dessen Verbesserung durch alternative Lösungsansätze. Hier handelt es sich um zwei allgemeine Probleme. Für das Einkamerasystem werden direkte Lösungsmöglichkeiten des Räumlichen Rückwärtsschnittes aufgezeigt. Im Fall eines Zweikamerasystems findet eine Verbesserung der Punktzuordnung statt. Diese basiert insbesondere auf der Berücksichtigung der Oberfläche der Objekte. Diese Teilaufgaben werden in den einleitenden Abschnitten der drei Teile genau spezifiziert.
Aufbau der Arbeit
Diese Diplomarbeit befasst sich mit drei verschiedenen Aspekten der Onlinemesssyste¬me WHEELWATCH und MoveINSPECT. Aus diesem Grund besteht dieses Dokument aus drei großen Teilen. Der Teil I trägt den Titel "Genauigkeitsbeurteilung von optischen Onlinemesssystemen". Darunter befindet sich die Entwicklung von zwei Testverfahren, die speziell für die Systeme WHEELWATCH und MoveINSPECT konzipiert werden. Dabei beziehen sich die Testverfahren zur Untersuchung der Genauigkeit zum einen auf Strecken und zum anderen auf Winkel. Die genaue Vorgehensweise ist dem ersten Teil dieser Arbeit zu entnehmen. Die beiden folgenden Teile befassen sich mit der Verbesserung der Algorithmik der Onlinemesssysteme. Dabei stellt der Teil Il Alternativen zum Räumlicher Rückwärtsschnitt (RRS) des Systems WHEEL WATCH vor. Das Ziel dieses Abschnitts ist es das bisher von der Firma AICON 3D Systems GmbH implementierte iterative Verfahren des RRS durch ein direktes zu erweitern. Die direkte Lösung des RRS dient dann zur Bestimmung der Näherungswerte für das iterative Verfahren. Mit der Algorithmik des Systems MoveINSPECT befasst sich der Teil III. Hier werden neue Ansatzmöglichkeiten aufgezeigt, um das Problem der Zuordnung von uncodierten Marken bei einem Zweikamerasystem zu verringern.
[ BibTex ]
@MASTERSTHESIS{abendroth*09:genauigkeitsbeurteilung,
author = "Abendroth, Birgit and zur M\"{u}hlen, Miriam",
title = "Genauigkeitsbeurteilung und Untersuchungen der Zuverlässigkeit von optischen Onlinemessungen",
year = "2009",
school="Institute of Photogrammetry, University of Bonn",
type="Diploma Thesis",
}
Bender, Daniel:
3D-Rekonstruktion von Blatträndern
Diplomarbeit, Bonn 2009
Betreuung: Prof.Dr.-Ing. Wolfgang Förstner, Prof.Dr. Daniel Cremers [ Zusammenfassung ]
Einleitung:
Der Anbau von Pflanzen in der Landwirtschaft ist durch eine zunehmende Automatisierung geprägt. Unter anderem werden hierbei Verfahren der Bildverarbeitung eingesetzt, welche zum Beispiel eine Beobachtung von Wachstum, Krankheiten oder Reifegrad der Pflanze sowie die Erkennung von Unkraut ermöglichen. Ausgehend von den Ergebnissen kann eine optimierte Produktion vollzogen und infolgedessen der Ertrag erhöht werden. Bereits an diesen Einsatzgebieten lässt sich erkennen, warum ein großes Interesse an der Verwendung von Bildverarbeitungsverfahren beim Pflanzenanbau besteht.
1.1 AufgabensteIlung
Ziel dieser Diplomarbeit ist es, eine Anwendung zu entwickeln, welche die automatische 3-D-Rekonstruktion von Blatträndern ermöglicht. Dazu wird, aufbauend auf die 2-D-Konturen mehrerer Aufnahmen eines Blattes, ein Energieminimierungsansatz entwickelt, durch den die optimale 3-D-Kontur berechnet werden kann. Dieses Verfahren wird mit realen Aufnahmen von Rübenblättern getestet, wodurch jedoch nur ein visueller Eindruck über die Qualität der Ergebnisse gewonnen werden kann. Um fundierte Aussagen über die Qualität der Ergebnisse treffen zu können, soll im Anschluss ein Verfahren zur Erstellung von synthetischen Szenen erarbeitet und mit diesen eine statistische Auswertung vollzogen werden.
1.2 Motivation
Als Silhouette wird der Umriss eines abgebildeten Körpers beschrieben. Sie ist in den meisten Aufnahmen leicht zu extrahieren und häufig der stärkste Hinweis für das abgebildete 3-D-Modell. Aus diesem Grund wird in verschiedenen Verfahren zur vollständigen 3-D-Rekonstruktion die Projektion des 3-D-Modells auf die Silhouetten der Aufnahmen als Kriterium verwendet [PZF05]. Bei Abbildungen von Blättern stimmt für Aufnahmen ohne Scheinkonturen die Silhouette mit der jeweiligen Kontur des Blattes überein. Dies ermöglicht eine Rekonstruktion des Blattrandes durch den in der vorliegenden Arbeit beschriebenen Algorithmus. Ausgehend von dieser Kurve im 3-D-Raum können bereits Aussagen über das Wachstum einer Pflanze getroffen oder bestimmte Klassifizierungen vorgenommen werden. Des Weiteren kann basierend auf der berechneten 3- D- Kontur eine vollständige 3- D- Rekonstruktion vollzogen werden. Insbesondere bei Blättern sind hierbei der Einfluss der Beleuchtung und hierdurch auftretende Spiegelungen innerhalb des Blattes zu beachten, welche die komplette 3-D-Rekonstruktion erheblich erschweren. Möglicherweise kann die Qualität einer kompletten 3-D-Rekonstruktion durch die Übergabe der bekannten 3-D-Kontur verbessert werden.
1.3 Verwandte Arbeiten
Bei der Rekonstruktion von 3-D-Kurven durch ihre Abbildungen in mehrere Bilder handelt es sich um ein Problem, welches bis zum aktuellen Zeitpunkt noch nicht umfassend erforscht worden ist. Jedoch sind vereinzelt Arbeiten zu finden, welche die Fragestellung bearbeiten. Von diesen werden im Folgenden zwei Arbeiten kurz beschrieben, deren Hauptaugenmerk ebenfalls auf der 3-D-Rekonstruktion von Blätträndern liegt: In [ZWZY08] wird ein Verfahren zur 3-D-Rekonstruktion von Maispflanzen vorgestellt, wobei die Rekonstruktion eines Blattes (Abbildung 1.1) auf zwei Aufnahmen basiert. In diesen werden mithilfe des Canny-Algorithmus [Can86] Kanten extrahiert, aus welchen eine automatische Auswahl getroffen wird. Die anschließende Zuordnung homologer Kanten wird jedoch manuell vollzogen. Es folgen die 3-D-Rekonstruktionen des Blattrandes und der in einer Maispflanze zentral verlaufenden Blattader durch ein Schneiden der Kurven im Raum. Anschließend wird in der Arbeit eine Oberfläche ausgehend von den gefundenen 3-D-Konturen triangliert. Dies ist möglich, da Blätter von Maispflanzen sehr schmal sind und daher die rekonstruierten 3-D-Konturen nahe beieinander liegen. In [Nie04] wird die 3-D-Rekonstruktion von Blättern junger Maispflanzen mit NURBS [PT96] vollzogen. Dabei werden zunächst die Konturen der Blätter manuell gekennzeichnet, um anschließend als Eingabe für die Konstruktion des 3-D-Modells zu dienen. Die theoretische Grundlage ist ein Verfahren, das für eine spezielle Konfiguration von drei Kameras eine 3-D-NURBS-Kurve eines freigeformten, linienähnlichen Objektes konstruiert [DXP+Ü3]. Zunächst wird dazu die Abbildung des Objektes in den jeweiligen Bildern in Form von 2-D-NURBS-Kurven approximiert. Sind diese in allen Bildern durch eine gleiche Anzahl von Kontrollpunkten und einen übereinstimmenden Knotenvektor dargestellt, so können die Kontrollpunkte im 3-D-Raum rekonstruiert werden und führen zur gesuchten Rekonstruktion durch eine 3-D-NURBS-Kurve.
1.4 Aufbau der Arbeit
Zu Beginn wird in Kapitel 2 die Vorverarbeitung der Eingabebilder beschrieben. In diesen wird zunächst mit einem Graph-Cut- Verfahren das Blatt segmentiert und anschließend seine Kontur extrahiert. Es folgt die Berechnung einer Distanztransformation des Konturbildes, wodurch für jeden Bildpunkt der Abstand zur Kontur angegeben wird. In Kapitel 3 wird der in dieser Arbeit vorgestellte Algorithmus zur 3-D-Rekonstruktion des Blattrandes beschrieben. Anschließend werden in Kapitel 4 die Erstellung einer synthetischen Szene zur Bewertung der Ergebnisse und die verwendeten Mittel zur statistischen Auswertung der Fehler dargestellt. In Kapitel 5 werden für reale und synthetische Bilder die Ergebnisse durchgeführter Experimente präsentiert und erörtert. Zum Abschluss der Arbeit folgen in Kapitel 6 eine Zusammenfassung und ein Ausblick auf mögliche Weiterführungen und Alternativen des vorgestellten Verfahrens.
Der Anbau von Pflanzen in der Landwirtschaft ist durch eine zunehmende Automatisierung geprägt. Unter anderem werden hierbei Verfahren der Bildverarbeitung eingesetzt, welche zum Beispiel eine Beobachtung von Wachstum, Krankheiten oder Reifegrad der Pflanze sowie die Erkennung von Unkraut ermöglichen. Ausgehend von den Ergebnissen kann eine optimierte Produktion vollzogen und infolgedessen der Ertrag erhöht werden. Bereits an diesen Einsatzgebieten lässt sich erkennen, warum ein großes Interesse an der Verwendung von Bildverarbeitungsverfahren beim Pflanzenanbau besteht.
1.1 AufgabensteIlung
Ziel dieser Diplomarbeit ist es, eine Anwendung zu entwickeln, welche die automatische 3-D-Rekonstruktion von Blatträndern ermöglicht. Dazu wird, aufbauend auf die 2-D-Konturen mehrerer Aufnahmen eines Blattes, ein Energieminimierungsansatz entwickelt, durch den die optimale 3-D-Kontur berechnet werden kann. Dieses Verfahren wird mit realen Aufnahmen von Rübenblättern getestet, wodurch jedoch nur ein visueller Eindruck über die Qualität der Ergebnisse gewonnen werden kann. Um fundierte Aussagen über die Qualität der Ergebnisse treffen zu können, soll im Anschluss ein Verfahren zur Erstellung von synthetischen Szenen erarbeitet und mit diesen eine statistische Auswertung vollzogen werden.
1.2 Motivation
Als Silhouette wird der Umriss eines abgebildeten Körpers beschrieben. Sie ist in den meisten Aufnahmen leicht zu extrahieren und häufig der stärkste Hinweis für das abgebildete 3-D-Modell. Aus diesem Grund wird in verschiedenen Verfahren zur vollständigen 3-D-Rekonstruktion die Projektion des 3-D-Modells auf die Silhouetten der Aufnahmen als Kriterium verwendet [PZF05]. Bei Abbildungen von Blättern stimmt für Aufnahmen ohne Scheinkonturen die Silhouette mit der jeweiligen Kontur des Blattes überein. Dies ermöglicht eine Rekonstruktion des Blattrandes durch den in der vorliegenden Arbeit beschriebenen Algorithmus. Ausgehend von dieser Kurve im 3-D-Raum können bereits Aussagen über das Wachstum einer Pflanze getroffen oder bestimmte Klassifizierungen vorgenommen werden. Des Weiteren kann basierend auf der berechneten 3- D- Kontur eine vollständige 3- D- Rekonstruktion vollzogen werden. Insbesondere bei Blättern sind hierbei der Einfluss der Beleuchtung und hierdurch auftretende Spiegelungen innerhalb des Blattes zu beachten, welche die komplette 3-D-Rekonstruktion erheblich erschweren. Möglicherweise kann die Qualität einer kompletten 3-D-Rekonstruktion durch die Übergabe der bekannten 3-D-Kontur verbessert werden.
1.3 Verwandte Arbeiten
Bei der Rekonstruktion von 3-D-Kurven durch ihre Abbildungen in mehrere Bilder handelt es sich um ein Problem, welches bis zum aktuellen Zeitpunkt noch nicht umfassend erforscht worden ist. Jedoch sind vereinzelt Arbeiten zu finden, welche die Fragestellung bearbeiten. Von diesen werden im Folgenden zwei Arbeiten kurz beschrieben, deren Hauptaugenmerk ebenfalls auf der 3-D-Rekonstruktion von Blätträndern liegt: In [ZWZY08] wird ein Verfahren zur 3-D-Rekonstruktion von Maispflanzen vorgestellt, wobei die Rekonstruktion eines Blattes (Abbildung 1.1) auf zwei Aufnahmen basiert. In diesen werden mithilfe des Canny-Algorithmus [Can86] Kanten extrahiert, aus welchen eine automatische Auswahl getroffen wird. Die anschließende Zuordnung homologer Kanten wird jedoch manuell vollzogen. Es folgen die 3-D-Rekonstruktionen des Blattrandes und der in einer Maispflanze zentral verlaufenden Blattader durch ein Schneiden der Kurven im Raum. Anschließend wird in der Arbeit eine Oberfläche ausgehend von den gefundenen 3-D-Konturen triangliert. Dies ist möglich, da Blätter von Maispflanzen sehr schmal sind und daher die rekonstruierten 3-D-Konturen nahe beieinander liegen. In [Nie04] wird die 3-D-Rekonstruktion von Blättern junger Maispflanzen mit NURBS [PT96] vollzogen. Dabei werden zunächst die Konturen der Blätter manuell gekennzeichnet, um anschließend als Eingabe für die Konstruktion des 3-D-Modells zu dienen. Die theoretische Grundlage ist ein Verfahren, das für eine spezielle Konfiguration von drei Kameras eine 3-D-NURBS-Kurve eines freigeformten, linienähnlichen Objektes konstruiert [DXP+Ü3]. Zunächst wird dazu die Abbildung des Objektes in den jeweiligen Bildern in Form von 2-D-NURBS-Kurven approximiert. Sind diese in allen Bildern durch eine gleiche Anzahl von Kontrollpunkten und einen übereinstimmenden Knotenvektor dargestellt, so können die Kontrollpunkte im 3-D-Raum rekonstruiert werden und führen zur gesuchten Rekonstruktion durch eine 3-D-NURBS-Kurve.
1.4 Aufbau der Arbeit
Zu Beginn wird in Kapitel 2 die Vorverarbeitung der Eingabebilder beschrieben. In diesen wird zunächst mit einem Graph-Cut- Verfahren das Blatt segmentiert und anschließend seine Kontur extrahiert. Es folgt die Berechnung einer Distanztransformation des Konturbildes, wodurch für jeden Bildpunkt der Abstand zur Kontur angegeben wird. In Kapitel 3 wird der in dieser Arbeit vorgestellte Algorithmus zur 3-D-Rekonstruktion des Blattrandes beschrieben. Anschließend werden in Kapitel 4 die Erstellung einer synthetischen Szene zur Bewertung der Ergebnisse und die verwendeten Mittel zur statistischen Auswertung der Fehler dargestellt. In Kapitel 5 werden für reale und synthetische Bilder die Ergebnisse durchgeführter Experimente präsentiert und erörtert. Zum Abschluss der Arbeit folgen in Kapitel 6 eine Zusammenfassung und ein Ausblick auf mögliche Weiterführungen und Alternativen des vorgestellten Verfahrens.
[ BibTex ]
@MASTERSTHESIS{bender09:3d-rekonstruktion,
author = "Bender, Daniel",
title = "3D-Rekonstruktion von Blatträndern",
year = "2009",
school="University of Bonn",
type="Diploma Thesis"
}
Pilger, Marko:
Automatische Bestimmung skalierungsinvarianter Fenster für markante Bildpunkte
Diplomarbeit, Bonn 2009
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Inform. Timo Dickscheid [ Zusammenfassung ]
Wir haben basierend auf dem Interestoperator von Förstner und Gülch einen skaleninvarianten Operator in Matlab implementiert, der möglichst präzise lokalisierbare Kantenschnittpunkte und ihre Skalen aus Bildern extrahiert. Dazu wurden C++-Bibliotheken zur Rauschschätzung und zur schnellen Berechnung von Faltungen nach der Methode von Deriche für Matlab verfügbar gemacht.
Leider hat sich herausgestellt, dass die Faltungen mit dem Deriche-Filter für unsere spezielle Anwendung nicht geeignet ist: Es entstehen Artefakte in unserer Optimierungsfunktion, so dass eine zuverlässige Auswertung nicht gewährleistet ist.
Indem wir unsere Funktionen durch Faltungen im Frequenzbereich berechnet haben, konnten wir zunächst auf Testbildern Kantenschnittpunkte mit entsprechenden Skalen extrahieren. Perfekte Skaleninvarianz bei Maßstabsänderung des Bildes konnten wir in einem Experiment nicht nachweisen: die detektierte Skala eines Kantenschnittpunktes wuchs im Experiment nicht schnell genug mit dem größer werdenden Bildmaßstab mit.
Dennoch erzielten wir auf realen Bildern gute Ergebnisse und detektierten auf zwei Bildern, die sich durch bekannte geometrische oder radiometrische Transformationen unterscheiden, prozentual ähnlich viele korrespondierende Punkte und Skalen wie existierende skaleninvariante Interestoperatoren. Gemessen an der absoluten Zahl der Detektionen liegt unser Operator weit hinter dem SIFT-Operator und dem Harris-Laplace Operator - beide entdecken auf realen Bildern meist mehr als doppelt so viele Punkte wie unser Operator. Allerdings kann unser Operator auf einen weiteren Typus von Interestpunkten erweitert werden, das sind Zentren kreissymmetrischer Bildmerkmale, oder allgemeiner auch auf spiralartige Merkmale. Damit kann in Zukunft möglicherweise das Manko der geringen Anzahl an Detektionen überwunden werden.
Ohne einen Schwellwert detektiert unser Operator auch zufällig verteilte Punkte und Skalen in homogenen Bildbereichen. Wir haben gezeigt, dass es sinnvoll ist, ein Homogenitätsmaß zu benutzen, um Detektionen auf homogenen Bildbereichen zu unterdrücken, und dennoch auch nicht so gut lokalisierte Punkte, die aber zu einer Bildorientierung beitragen können, zu erhalten.
Unser Operator lässt im derzeitigen Entwicklungsstadium noch Raum für Erweiterungen: neben der schon erwähnten Einbeziehung weiterer Punktmerkmale kann bei Farbbildern die Information aller drei Kanäle in die Detektion mit einbezogen werden, ähnlich wie bei Fuchs (1997), ohne das Bild unter Informationsverlust auf einen Helligkeitskanal zu reduzieren. Außerdem könnte untersucht werden, ob sich ein Oversampling des Bildes vor der Berechnung der quadratischen Gradienten, wie es Köthe (2003) vorschlägt, vorteilhaft auf die Punktdetektionen auswirkt. Wichtig für Anwendungen in der Praxis wäre auch eine deutliche Geschwindigkeitssteigerung. Abhängig von Bildgröße, Anzahl detektierter Punktkandidaten und Diskretisierungsdichte des Skalenraums kann die Detektion für ein Bild der Größe (800 x 800pel) bei eingeschalteter Subpixelschätzung auf einem 2,4 GHz Computer 15 Minuten dauern. Die meiste Zeit beanspruchen dabei die Faltungen und die kubische Interpolation bei der Subpixelschätzung. Die Zeit für die Faltungen könnte durch einen Übergang auf eine Pyramidendarstellung des Bildes im Skalenraum reduziert werden.
[ BibTex ]
@MASTERSTHESIS{pilger09:automatische,
author = "Pilger, Marko",
title = "Automatische Bestimmung skalierungsinvarianter Fenster für markante Bildpunkte",
school="Institute of Photogrammetry, University of Bonn",
type="Diploma Thesis",
year = "2009",
}
Schneider, Johannes:
Untersuchung von Farbinvarianten für die Erzeugung von Merkmalsdeskriptoren
Bachelorarbeit, Bonn 2009
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. Susanne Wenzel [ Zusammenfassung ]
Zusammenfassung:
Diese Arbeit beschäftigt sich mit Farbinvarianten insbesondere unter dem Aspekt der Nutzung dieser zur Merkmalsdeskription bei der Punktzuordnung. Hierzu wird die Arbeit von [Burghouts and Geusebroek, 2009] theoretisch aufgearbeitet und drei der dort vorgestellten Farbinvarianten werden für die Zuordnung mit SIFT-Deskriptoren implementiert und empirisch evaluiert. Zur Einführung in die Thematik werden die theoretischen Grundlagen der Farbinvarianz dargestellt, wobei vor allem der Begriff "Farbinvarianz" erläutert wird. Anschließend wird die physikalische Herleitung der Farbinvarianten aufgezeigt. Um die Farbinvarianten rechentechnisch bestimmbar zu machen, wird das Gaußsche Farbmodell verwendet. Die Implementierung der farbbasierten Colour-SIFT-Deskriptoren wird auf der Grundlage gemessener RGB- Werte durchgeführt. Die Farbgradienten werden im SIFT-Verfahren anstatt der Intensitätsgradienten für die Detektion und die Merkmalsdeskription verwendet. Es werden in dieser Arbeit drei verschiedene Colour-SIFT vorgestellt und untersucht: Der gegen Änderungen in der Beleuchtungsintensität invariante W-colour-SIFT, der C-colour-SIFT, welcher zudem invariant gegenüber Schatten ist und der H-colour-SIFT, welcher neben den genannten Eigenschaften zudem gegen Glanzlichteffekte invariant ist. Die Eignung der farbinvarianten Gradientenbilder zur Merkmalsdeskription wird durch zwei Verfahren der Implementierung eines Colour-SIFT untersucht: Das Verfahren COL ordnet Punkte basierend auf den jeweiligen Farbgradienten zu, ohne die Intensitätsgradienten zu verwenden. Das Verfahren COL+ INT extrahiert Regionen aus der Verteilung der Intensitäts- und Farbgradienten. Für jede extrahierte Region wird jeweils ein Merkmalsdeskriptor auf Grundlage der Intensitätsgradienten als auch der Farbgradienten bestimmt. Zur Untersuchung dieser Deskriptoren werden die Verfahren zur Evaluation von Mikolajczyk und Schmid verwendet. Die Merkmalsdeskriptoren werden auf die diskriminative Leistungsfähigkeit und Invarianz untersucht. Die Anwendung der von Lowe veröffentlichten SIFT-Implementierung erlaubt einen direkten Vergleich zu den implementierten Colour-SIFT. Das Ergebnis der Untersuchung zeigt den Vorzug des schatteninvarianten C-colour-SIFT bei der Zuordnung von Bildern, bei denen sich die Beleuchtungsrichtung ändert. Auch bei der Änderung der Aufnahmerichtung erzielte der C-colour-SIFT bessere Ergebnisse als der SIFT. Der H-colour-SIFT kann jedoch die hohen Erwartungen auf Grund des hohen Grades an Invarianz nicht erfüllen. Dieser ist vor allem bei Änderungen in der Farbtemperatur sehr instabil. Als problematisch erweist sich das vollständige Fehlen der Intensitätsinformation bei dieser Farbinvarianten. Der W-colour-SIFT erzielt keine signifikant besseren Ergebnisse als der von Lowe veröffentlichte SIFT.
Abstract:
This bachelor thesis treats the subject of colour invariants with special regards to their purpose as feature descriptors for region matching. Hence, a structured review of the theoretical content of the article by [Burghouts and Geusebroek, 2009] is given and three of the colour invariants presented in this article are implemented for the SIFT-based matching and empirically evaluated. As an introduction into the subject the theoretical basics of colour constancy are presented with a primary emphasis on the explication of the term "Colour Invariance". Thus, the physical derivation of colour invariants is shown. A computed value for the colour invariants can be obtained by the use of the Gaussian colour model. The implementation of the colour based Colour-SIFT-descriptors is carried out on the basis of measured RGB-values. The colour gradients are used instead of the intensity gradients for the detection and the feature description in the SIFT-method. In this thesis three different Colour-SIFT are presented and tested: The W-colour-SIFT, which is invariant to changes in illumination intensity, the C-colour-SIFT, which is furthermore invariant to shadow and shading and the H-colour-SIFT, which is in addition to the properties mentioned above invariant to highlights. The applicability of images with colour invariant gradients for feature description is tested by two implementation methods of a Colour-SIFT: The COL-method matches regions in relation to their respective colour gradients without using intensity gradients. The COL+ INT-method extracts regions in relation to intensity as well as colour gradients. For every extracted region a descriptor on the basis of its intensity gradients and its colour gradients is defined. For the test of these descriptors the basic framework of the evaluation by Mikolajczyk and Schmid is adopted. The evaluation tests the feature descriptors' discriminative power and invariance. The application of the SIFT implementation published by Lowe allows a direct comparison to the implemented Colour-SIFT. The result of the test shows the advantage of the C-colour-SIFT, invariant to shadow and shading, concerning the matching of images under changing illumination directions. Also concerning changes in viewpoint the C-colour-SIFT obtained better results than the SIFT. The H-colour-SIFT cannot fulfil the high expectations due to its high level of invariance. Especially in changing colour temperatures the H-colour-SIFT is very instable. The lack of intensity information seriously affects the discriminative power. The W-colour-SIFT does not come to any significantly better results than the SIFT provided by Lowe.
Diese Arbeit beschäftigt sich mit Farbinvarianten insbesondere unter dem Aspekt der Nutzung dieser zur Merkmalsdeskription bei der Punktzuordnung. Hierzu wird die Arbeit von [Burghouts and Geusebroek, 2009] theoretisch aufgearbeitet und drei der dort vorgestellten Farbinvarianten werden für die Zuordnung mit SIFT-Deskriptoren implementiert und empirisch evaluiert. Zur Einführung in die Thematik werden die theoretischen Grundlagen der Farbinvarianz dargestellt, wobei vor allem der Begriff "Farbinvarianz" erläutert wird. Anschließend wird die physikalische Herleitung der Farbinvarianten aufgezeigt. Um die Farbinvarianten rechentechnisch bestimmbar zu machen, wird das Gaußsche Farbmodell verwendet. Die Implementierung der farbbasierten Colour-SIFT-Deskriptoren wird auf der Grundlage gemessener RGB- Werte durchgeführt. Die Farbgradienten werden im SIFT-Verfahren anstatt der Intensitätsgradienten für die Detektion und die Merkmalsdeskription verwendet. Es werden in dieser Arbeit drei verschiedene Colour-SIFT vorgestellt und untersucht: Der gegen Änderungen in der Beleuchtungsintensität invariante W-colour-SIFT, der C-colour-SIFT, welcher zudem invariant gegenüber Schatten ist und der H-colour-SIFT, welcher neben den genannten Eigenschaften zudem gegen Glanzlichteffekte invariant ist. Die Eignung der farbinvarianten Gradientenbilder zur Merkmalsdeskription wird durch zwei Verfahren der Implementierung eines Colour-SIFT untersucht: Das Verfahren COL ordnet Punkte basierend auf den jeweiligen Farbgradienten zu, ohne die Intensitätsgradienten zu verwenden. Das Verfahren COL+ INT extrahiert Regionen aus der Verteilung der Intensitäts- und Farbgradienten. Für jede extrahierte Region wird jeweils ein Merkmalsdeskriptor auf Grundlage der Intensitätsgradienten als auch der Farbgradienten bestimmt. Zur Untersuchung dieser Deskriptoren werden die Verfahren zur Evaluation von Mikolajczyk und Schmid verwendet. Die Merkmalsdeskriptoren werden auf die diskriminative Leistungsfähigkeit und Invarianz untersucht. Die Anwendung der von Lowe veröffentlichten SIFT-Implementierung erlaubt einen direkten Vergleich zu den implementierten Colour-SIFT. Das Ergebnis der Untersuchung zeigt den Vorzug des schatteninvarianten C-colour-SIFT bei der Zuordnung von Bildern, bei denen sich die Beleuchtungsrichtung ändert. Auch bei der Änderung der Aufnahmerichtung erzielte der C-colour-SIFT bessere Ergebnisse als der SIFT. Der H-colour-SIFT kann jedoch die hohen Erwartungen auf Grund des hohen Grades an Invarianz nicht erfüllen. Dieser ist vor allem bei Änderungen in der Farbtemperatur sehr instabil. Als problematisch erweist sich das vollständige Fehlen der Intensitätsinformation bei dieser Farbinvarianten. Der W-colour-SIFT erzielt keine signifikant besseren Ergebnisse als der von Lowe veröffentlichte SIFT.
Abstract:
This bachelor thesis treats the subject of colour invariants with special regards to their purpose as feature descriptors for region matching. Hence, a structured review of the theoretical content of the article by [Burghouts and Geusebroek, 2009] is given and three of the colour invariants presented in this article are implemented for the SIFT-based matching and empirically evaluated. As an introduction into the subject the theoretical basics of colour constancy are presented with a primary emphasis on the explication of the term "Colour Invariance". Thus, the physical derivation of colour invariants is shown. A computed value for the colour invariants can be obtained by the use of the Gaussian colour model. The implementation of the colour based Colour-SIFT-descriptors is carried out on the basis of measured RGB-values. The colour gradients are used instead of the intensity gradients for the detection and the feature description in the SIFT-method. In this thesis three different Colour-SIFT are presented and tested: The W-colour-SIFT, which is invariant to changes in illumination intensity, the C-colour-SIFT, which is furthermore invariant to shadow and shading and the H-colour-SIFT, which is in addition to the properties mentioned above invariant to highlights. The applicability of images with colour invariant gradients for feature description is tested by two implementation methods of a Colour-SIFT: The COL-method matches regions in relation to their respective colour gradients without using intensity gradients. The COL+ INT-method extracts regions in relation to intensity as well as colour gradients. For every extracted region a descriptor on the basis of its intensity gradients and its colour gradients is defined. For the test of these descriptors the basic framework of the evaluation by Mikolajczyk and Schmid is adopted. The evaluation tests the feature descriptors' discriminative power and invariance. The application of the SIFT implementation published by Lowe allows a direct comparison to the implemented Colour-SIFT. The result of the test shows the advantage of the C-colour-SIFT, invariant to shadow and shading, concerning the matching of images under changing illumination directions. Also concerning changes in viewpoint the C-colour-SIFT obtained better results than the SIFT. The H-colour-SIFT cannot fulfil the high expectations due to its high level of invariance. Especially in changing colour temperatures the H-colour-SIFT is very instable. The lack of intensity information seriously affects the discriminative power. The W-colour-SIFT does not come to any significantly better results than the SIFT provided by Lowe.
[ BibTex ]
@MASTERSTHESIS{schneider09:untersuchung,
author = "Schneider, Johannes",
title = "Untersuchung von Farbinvarianten für die Erzeugung von Merkmalsdeskriptoren",
school="Department of Photogrammetry, University of Bonn",
type="Bachelor Thesis",
year = "2009",
}
Schultz, Rebekka:
Orientierung einer Kamera in einer Legolandszene
Bachelorarbeit, Bonn 2009
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.- Inform. Timo Dickscheid [ Zusammenfassung ]
Diese Arbeit untersucht ein Verfahren zur Bestimmung der äußeren Orientierung einer Kamera. Für viele Anwendungen in der Photogrammetrie ist es interessant, die äußere Orientierung der Kamera mit geringem Aufwand schätzen zu können. Die äußere Orientierung beschreibt die räumliche Lage der Kamera im Objektkoordinatensystem und lässt sich über die Fluchtpunkte bestimmen.
Die Fluchtpunkte lassen sich in einer Legolandszene durch parallele Objektkanten schätzen. In einer Legolandszene bestehen alle Objekte aus Polyedern, die ausschließlich rechte Winkel haben. Hierbei sind die Polyeder parallel zueinander angeordnet. Legolandszenen sind eine Vereinfachung realer Bilder. Sie sollen dem Erlernen des Erkennens von Strukturen, in diesem Falle von Objektkanten dienen.
Ziel ist es, eine Methode zu entwickeln, mit deren Hilfe im Bild Objektkanten, die zum gleichen Fluchtpunkt führen, gefunden werden können. Auf Grundlage dieser Kanten kann die äußere Orien-tierung der Kamera bestimmt werden.
Es existiert ein Verfahren zur Bestimmung der äußeren Orientierung der Kamera, unter der Voraussetzung, dass die innere Orientierung bekannt ist. Dieses Verfahren wurde an der Universität Bonn von Prof. Förstner entwickelt. Aufgabe der Bachelorarbeit ist es, dieses Verfahren bezüglich seiner Kantenwahl zu verbessern.
Es wurden in den Bildern Kanten segmentiert, unter welchen Kantenpaare manuell dahingehend untersucht wurden, ob sie zum gleichen Fluchtpunkt führen. Diese Datenmenge wurde in eine Test- und Trainingsmenge unterteilt. Die Daten der Trainingsmenge wurden verwendet, um anhand von geometrischen Eigenschaften zu untersuchen, ob ein Kantenpaar zum gleichen Fluchtpunkt führt.
Es wurden der Abstand und der Winkel zwischen zwei Kanten sowie deren Überlappung untersucht. Weiterhin wurde zu den extrahierten Kanten eine Dreiecksvermaschung durch eine bedingte Delaunay- Triangulierung konstruiert, mit deren Hilfe ein Kantenzuordnungsverfahren entwickelt wurde.
Diese geometrischen Eigenschaften wurden vorerst einzeln und später in Kombination mittels eines Entscheidungsbaumes untersucht.
Die für die Eigenschaften ermittelten Kriterien wurden mit den Daten der Testmenge überprüft. Bei den untersuchten Daten erwies sich ein Winkel zwischen 13° und 19° als effektiv. Hiermit wurden 58 % der theoretisch maximalen Utility durch fehlerfreie Klassifikation erreicht, im Kontrast zu 10 % des ursprünglichen Verfahrens.
[ BibTex ]
@MASTERSTHESIS{schultz09:orientierung,
author = "Schultz, Rebekka",
title = "Orientierung einer Kamera in einer Legolandszene",
year = "2009",
type="Bachelor Thesis",
school="Institute of Photogrammetry, University of Bonn",
}
Staufenbiel, Lars:
Zeitreihenanalyse der Verteilung von Blattflecken
Bachelorarbeit, Bonn 2009
Betreuung: Prof.Dr.-Ing. Wolfgang Förstner, Dipl.-Inform. Sabine D. Bauer [ Zusammenfassung ]
Zusammenfassung:
Eines der Ziele der Präzisionslandwirtschaft ist es, eine Schädlingsbekämpfung nur dort auf dem Feld durchzuführen, wo sich auch tatsächlich infizierte Pflanzen befinden. Die automatische Erkennung kranker Blätter auf landwirtschaftlichen Flächen kann bei Vorkenntnis über den Krankheitsverlauf verbessert werden. Die Aufgabe dieser Bachelorarbeit bestand darin, die zeitliche Ent-wicklung von Cercospora-Blattflecken auf einer bestimmten Sorte von Zuckerrübenblättern zu bestimmen. In einer Zeitreihenanalyse sollte herausgefunden werden, ob die Krankheit ein bestimmtes Verhalten auf der Blattoberfläche zeigt und ob daraus Krankheitsmuster abzuleiten sind. Dazu sind im Vorfeld Orthophotos von mehreren Zuckerrübenblättern erstellt worden. Um die zeitliche Entwicklung verfolgen zu können, mussten zuerst Transformationen zwischen zeitlich benachbarten Aufnahmen berechnet werden. Im Zuge dessen entstanden Probleme bei der Suche nach homologen Punkten, da die Blätter im Beobachtungszeitraum zeitlichen Formveränderungen unterlagen. Insgesamt war es möglich 95% der Aufnahmen für die weitere Analyse zur Deckung zubringen. Die Passgenauigkeit der Modelle war dabei von der Qualität der bestimmten Korrespondenzen und der Stärke der Formveränderungen der Blätter abhängig. Bei geringen Formveränderungen konnten gute Ergebnisse mit homologen Punkten in stabilen Randbereichen erzielt werden. Die Transformation war ein wichtiger erster Schritt für die Zeitreihenanalyse. Damit bestand die Möglichkeit Blattflecken zeitlich benachbarter Aufnahmen miteinander vergleichen zu können. Sind Cercospora-Blattflecken in einer Region mit erhöhter Punktdichte in Erscheinung getreten, wurden diese als Cluster zusammengefasst. Dazu wurden Punktnachbarschaften über die Delaunay- Triangulierung gebildet. Dadurch konnte eine erste Aussage über die räumliche Verteilung der Blattflecken getroffen werden. Um das zeitliche Verhalten auf der Blattoberfläche zu verfolgen, sind die Cluster in den Folgeaufnahmen dann einander zugeordnet worden. Die Zuordnung erfolgte mit der gerichteten Hausdorff-Distanz, mit der ein Ähnlichkeitsmaß zwischen den Punktmengen berechnet werden konnte. Die Ergebnisse der Zeitreihenanalyse haben Aufschlüsse über das Krankheitsverhalten der Cercospora-Blattkrankheit gegeben. Es wurde festgestellt, dass Blattflecken sich erst eine Woche nach der Inokulation verstärkt vermehren. Am Anfang treten sie dabei vereinzelt auf der Blattober-fläche auf. Die Clusterbildung nimmt erst nach etwa zwei Wochen stark zu. Dies lässt uns Rück-schlüsse auf die Punktdichte der Blattflecken ziehen. Die eigentliche Befallsstärke der Krankheit konnte über das Verhältnis der Blattfläche zu der Fläche der Blattflecken angeben werden. Im Durchschnitt sind nach etwa drei Wochen mehr als 10% der Blattfläche mit Nekrosen bedeckt. Insgesamt liegt mit dieser Arbeit ein guter Ansatz für eine Zeitreihenanalyse der Verteilung von Blattflecken vor. Die aufgestellten Algorithmen bieten eine Vielzahl an Erweiterungsmöglichkeiten und können die Zeitreihenanalyse verbessern.
Abstract:
One of the goals of precision agriculture is to provide a pest control only on those parts the acreage where infected plants are actually located. The automatic recognition of sick leaves on agricultural acreages can be improved by the use of previous knowledge about the disease process. The aim of this bachelor thesis was to determine the progression of Cercospora leaf spots on a particular sort of sugar beet leaves over time. By a time series analysis it was attempted to determine whether the disease causes distinct effects on the leaf surface, and whether patterns correlating with certain diseases can be deduced from these effects. For this purpose, orthophotos of multiple sugar beet leaves were generated and analysed. In order to follow the development over time, the transformations between temporally close images had to be calculated. In the course of this procedure, problems arose in the search for homologous points, as the leaves were subject to (form) modifications within the observation period. Overall, it was possible to render congruent 95% of the images for further analysis, whereas the fitting accuracy of the models depended on the quality of the particular correspondences and on the intensity of shape changes of the leaves. For minor shape changes of the leaves, good results could be obtained with homologous points in stable boundary areas. The transformation was an important first step for the time series analysis, as it enabled comparison of temporally close images of leaf spots. When Cercospora leaf spots appeared in a region with increased point density, they were summarized to clusters. For this purpose, point neighbourhoods were formed by Delaunay triangulation. Thus a first statement about the spatial distribution of the leaf spots could be made. In order to pursue the temporal behavior on the leaf surface, the clusters in sequential images were then correlated with each other. The correlation was done by the use of aligned Hausdorff distance, by which a measure of similarity between point sets could be calculated. The results of the time series analysis contributed to understanding the pathogenesis of the Cercospora leaf disease. It was determined that leaf spots do not appear in high numbers until one week after inoculation. At the beginning, single spots are scattered over the leaf surface, while increased amounts of clusters appear after approximately two weeks. This lets to draw conclusions about the point density of the leaf spots. The actual intensity of an infection can be displayed by the relationship of the surface area of the leaf to the surface area of the leaf spots. On average, more than 10% of the leaf surface is covered with necroses after three weeks. Overall, this work is a good approach for a time series analysis on the distribution of leaf spots. The established algorithms offer a variety of expansion options, and can improve time series analysis.
Eines der Ziele der Präzisionslandwirtschaft ist es, eine Schädlingsbekämpfung nur dort auf dem Feld durchzuführen, wo sich auch tatsächlich infizierte Pflanzen befinden. Die automatische Erkennung kranker Blätter auf landwirtschaftlichen Flächen kann bei Vorkenntnis über den Krankheitsverlauf verbessert werden. Die Aufgabe dieser Bachelorarbeit bestand darin, die zeitliche Ent-wicklung von Cercospora-Blattflecken auf einer bestimmten Sorte von Zuckerrübenblättern zu bestimmen. In einer Zeitreihenanalyse sollte herausgefunden werden, ob die Krankheit ein bestimmtes Verhalten auf der Blattoberfläche zeigt und ob daraus Krankheitsmuster abzuleiten sind. Dazu sind im Vorfeld Orthophotos von mehreren Zuckerrübenblättern erstellt worden. Um die zeitliche Entwicklung verfolgen zu können, mussten zuerst Transformationen zwischen zeitlich benachbarten Aufnahmen berechnet werden. Im Zuge dessen entstanden Probleme bei der Suche nach homologen Punkten, da die Blätter im Beobachtungszeitraum zeitlichen Formveränderungen unterlagen. Insgesamt war es möglich 95% der Aufnahmen für die weitere Analyse zur Deckung zubringen. Die Passgenauigkeit der Modelle war dabei von der Qualität der bestimmten Korrespondenzen und der Stärke der Formveränderungen der Blätter abhängig. Bei geringen Formveränderungen konnten gute Ergebnisse mit homologen Punkten in stabilen Randbereichen erzielt werden. Die Transformation war ein wichtiger erster Schritt für die Zeitreihenanalyse. Damit bestand die Möglichkeit Blattflecken zeitlich benachbarter Aufnahmen miteinander vergleichen zu können. Sind Cercospora-Blattflecken in einer Region mit erhöhter Punktdichte in Erscheinung getreten, wurden diese als Cluster zusammengefasst. Dazu wurden Punktnachbarschaften über die Delaunay- Triangulierung gebildet. Dadurch konnte eine erste Aussage über die räumliche Verteilung der Blattflecken getroffen werden. Um das zeitliche Verhalten auf der Blattoberfläche zu verfolgen, sind die Cluster in den Folgeaufnahmen dann einander zugeordnet worden. Die Zuordnung erfolgte mit der gerichteten Hausdorff-Distanz, mit der ein Ähnlichkeitsmaß zwischen den Punktmengen berechnet werden konnte. Die Ergebnisse der Zeitreihenanalyse haben Aufschlüsse über das Krankheitsverhalten der Cercospora-Blattkrankheit gegeben. Es wurde festgestellt, dass Blattflecken sich erst eine Woche nach der Inokulation verstärkt vermehren. Am Anfang treten sie dabei vereinzelt auf der Blattober-fläche auf. Die Clusterbildung nimmt erst nach etwa zwei Wochen stark zu. Dies lässt uns Rück-schlüsse auf die Punktdichte der Blattflecken ziehen. Die eigentliche Befallsstärke der Krankheit konnte über das Verhältnis der Blattfläche zu der Fläche der Blattflecken angeben werden. Im Durchschnitt sind nach etwa drei Wochen mehr als 10% der Blattfläche mit Nekrosen bedeckt. Insgesamt liegt mit dieser Arbeit ein guter Ansatz für eine Zeitreihenanalyse der Verteilung von Blattflecken vor. Die aufgestellten Algorithmen bieten eine Vielzahl an Erweiterungsmöglichkeiten und können die Zeitreihenanalyse verbessern.
Abstract:
One of the goals of precision agriculture is to provide a pest control only on those parts the acreage where infected plants are actually located. The automatic recognition of sick leaves on agricultural acreages can be improved by the use of previous knowledge about the disease process. The aim of this bachelor thesis was to determine the progression of Cercospora leaf spots on a particular sort of sugar beet leaves over time. By a time series analysis it was attempted to determine whether the disease causes distinct effects on the leaf surface, and whether patterns correlating with certain diseases can be deduced from these effects. For this purpose, orthophotos of multiple sugar beet leaves were generated and analysed. In order to follow the development over time, the transformations between temporally close images had to be calculated. In the course of this procedure, problems arose in the search for homologous points, as the leaves were subject to (form) modifications within the observation period. Overall, it was possible to render congruent 95% of the images for further analysis, whereas the fitting accuracy of the models depended on the quality of the particular correspondences and on the intensity of shape changes of the leaves. For minor shape changes of the leaves, good results could be obtained with homologous points in stable boundary areas. The transformation was an important first step for the time series analysis, as it enabled comparison of temporally close images of leaf spots. When Cercospora leaf spots appeared in a region with increased point density, they were summarized to clusters. For this purpose, point neighbourhoods were formed by Delaunay triangulation. Thus a first statement about the spatial distribution of the leaf spots could be made. In order to pursue the temporal behavior on the leaf surface, the clusters in sequential images were then correlated with each other. The correlation was done by the use of aligned Hausdorff distance, by which a measure of similarity between point sets could be calculated. The results of the time series analysis contributed to understanding the pathogenesis of the Cercospora leaf disease. It was determined that leaf spots do not appear in high numbers until one week after inoculation. At the beginning, single spots are scattered over the leaf surface, while increased amounts of clusters appear after approximately two weeks. This lets to draw conclusions about the point density of the leaf spots. The actual intensity of an infection can be displayed by the relationship of the surface area of the leaf to the surface area of the leaf spots. On average, more than 10% of the leaf surface is covered with necroses after three weeks. Overall, this work is a good approach for a time series analysis on the distribution of leaf spots. The established algorithms offer a variety of expansion options, and can improve time series analysis.
[ BibTex ]
@MASTERSTHESIS{staufenbiel09:zeitreihenanalyse,
author = "Staufenbiel, Lars",
title = "Zeitreihenanalyse der Verteilung von Blattflecken",
school="Institute of Photogrammetry, University of Bonn",
type="Bachelor Thesis",
year = "2009",
}
Volkmann, Thorsten:
Segmentierung und Klassifikation von Oozytenbildern
Bachelorarbeit, Bonn 2009
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Inform. Martin Drauschke [ Zusammenfassung ]
Zusammenfassung:
Die Landwirtschaftliche Fakultät der Universität Bonn hat versucht, tierische Eizellen mit dem für die Humanmedizin entwickelten Programm Octax polarAIDE auf ihre weitere Entwicklung hin zu untersuchen. Dafür wurden die Eizellen unter einem Polarisationsmikroskop positioniert und mittels einer zusätzlich montierten Kamera abgelichtet. Die Untersuchungsergebnisse von Pferdeeizellen konnten jedoch nicht interpretiert werden, da die Resultate fehlerhaft waren. Ein Grund dafür war die fehlerhaft segmentierte Zona pellucida, sowie möglicherweise ungeeignete Merkmale. Um interpretationsfähige Ergebnisse zu erhalten war es nötig die Zona pellucida besser zu segmentieren und geeignete Merkmale für die Klassifikation zu extrahieren. Die Umsetzung dessen war Gegenstand dieser Bachelorarbeit. Eine Näherungslösung für die innere Ellipse wurde über den Kontrastunterschied im Grauwertbild der Eizelle berechnet. Zu diesem Zweck wurde ein Schwellwert gesucht, der die Region des Cytoplasmas von der Region der Zona pellucida abtrennt. Der Versuch, die Lage der Ellipse durch Veränderung der Ellipsenparameter, zu verbessern führte zu keinen brauchbaren Ergebnissen. Aus diesem Grund wurde die Näherungslösung als beste Lage angenommen. Für die Segmentierung der äußeren Ellipse wurde der Ansatz über die Änderung des Intensitätswertes, also das Gradientenbild eines Eizellenbildes gewählt. Die daraus resultierende Näherungslösung liegt aufgrund der im Binärbild auftretenden "Ausfransungen" außerhalb der Zona. Dieses wurde daraufhin mit einem Erosionsfilter bearbeitet, was eine verbesserte Approximation der äußeren Zona Hülle mit sich bringt. Um Merkmale für die Klassifikation der Eizellen zu erhalten wurde die Doppelbrechungsintensität in der segmentierten Zona als ein solches verwendet. Infolgedessen wurde die Zona in weitere Ringe aufgeteilt, die nochmals in Sektoren untergliedert wurden. Für die Bestimmung geeigneter Merkmale wurden verschiedene Kombinationen von Merkmalen auf ihre Genauigkeit hin untersucht. Zur Beurteilung der Ergebnisse wurde der Algorithmus auf den Trainingsbildern getestet und die Ergebnisse mit den Referenzdaten verglichen. Als geeignetes Merkmal haben sich die Mittelwerte und Streuungen der Doppelbrechungsintensität der Zona pellucida erwiesen. Mit ihnen werden nach der Klassifikation, mit Hilfe des Nächste-Nachbar-Klassifikators, je nach Konfiguration (Einteilung der Zona in Ringe) zwischen 60% und 75% der Bilder der richtigen Klasse zugeordnet. Daraus lässt sich die Erkenntnis ableiten, dass das im Zuge dieser Arbeit entwickelte Verfahren einen guten Ansatz zur Klassifizierung einer Pferdeeizelle, in Bezug auf die weitere Entwicklung, durch die Analyse der Doppelbrechungsintensität in der Zona pellucida ermöglicht.
Abstract:
The agricultural faculty at Bonn University tried to analyze animal ovules on their further evolution, assisted by the Octax polarAIDE software which was developed for use in human medicine. For this purpose the ovules were positioned to be examined with a d petrological microscope and photographed with an assembled camera. An interpretation of the results gained however was not possible, as there were deficiently segmented zona pellucida as well as possibly unsuitable features. To gain data that could be interpreted it was necessary to improve segmentation of the zona pellucida to achieve qualified data for a classification. The realization of this is object for this Bachelor thesis. An approximate solution for the internal ellipse has been calculated by using differences in contrast within grayscale images of the ovule. For this purpose a threshold had to be detected which separated the cytoplasm from the zona pellucida. The attempt to improve the position of the ellipses by changing the ellipse parameter did not afford suitable results. For this reason the approximate solution was assumed as the best position.For segmentation of the external ellipse, the method for the alteration of the first derivative in the gradient image of an ovule was chosen. The resulting approximate solution lies outside the zona because of the unevenness appearing in the binary image. Thereupon these were edited by using an Erosion filter which led to an enhanced approximation of the external cover of the zona. To obtain attributes for classification of the ovule intensity of double refraction of the segmented zona was used. Hence the zona was fragmented in further rings which were subdivided in sectors over again. For identification of appropriate features several combinations of them were analyzed on their accuracy. For evaluation of the results the algorithm of sample images was tested and the conclusions were compared with the reference data. The midpoint and the dispersion of the intensity of double refraction of the zona proved as a proper feature. After classification with these features aided through the nearest-neighbour-classificator and depending on configuration (division of the zona in rings) between 60 to 75 per cent of the images were dedicated in the correct category. Hence the conclusion can be deduced that the procedures developed in the course of this study a promising approach for classification of a horse ovum concerning the further development by analyzing the intensity of double refraction in the zona.
Die Landwirtschaftliche Fakultät der Universität Bonn hat versucht, tierische Eizellen mit dem für die Humanmedizin entwickelten Programm Octax polarAIDE auf ihre weitere Entwicklung hin zu untersuchen. Dafür wurden die Eizellen unter einem Polarisationsmikroskop positioniert und mittels einer zusätzlich montierten Kamera abgelichtet. Die Untersuchungsergebnisse von Pferdeeizellen konnten jedoch nicht interpretiert werden, da die Resultate fehlerhaft waren. Ein Grund dafür war die fehlerhaft segmentierte Zona pellucida, sowie möglicherweise ungeeignete Merkmale. Um interpretationsfähige Ergebnisse zu erhalten war es nötig die Zona pellucida besser zu segmentieren und geeignete Merkmale für die Klassifikation zu extrahieren. Die Umsetzung dessen war Gegenstand dieser Bachelorarbeit. Eine Näherungslösung für die innere Ellipse wurde über den Kontrastunterschied im Grauwertbild der Eizelle berechnet. Zu diesem Zweck wurde ein Schwellwert gesucht, der die Region des Cytoplasmas von der Region der Zona pellucida abtrennt. Der Versuch, die Lage der Ellipse durch Veränderung der Ellipsenparameter, zu verbessern führte zu keinen brauchbaren Ergebnissen. Aus diesem Grund wurde die Näherungslösung als beste Lage angenommen. Für die Segmentierung der äußeren Ellipse wurde der Ansatz über die Änderung des Intensitätswertes, also das Gradientenbild eines Eizellenbildes gewählt. Die daraus resultierende Näherungslösung liegt aufgrund der im Binärbild auftretenden "Ausfransungen" außerhalb der Zona. Dieses wurde daraufhin mit einem Erosionsfilter bearbeitet, was eine verbesserte Approximation der äußeren Zona Hülle mit sich bringt. Um Merkmale für die Klassifikation der Eizellen zu erhalten wurde die Doppelbrechungsintensität in der segmentierten Zona als ein solches verwendet. Infolgedessen wurde die Zona in weitere Ringe aufgeteilt, die nochmals in Sektoren untergliedert wurden. Für die Bestimmung geeigneter Merkmale wurden verschiedene Kombinationen von Merkmalen auf ihre Genauigkeit hin untersucht. Zur Beurteilung der Ergebnisse wurde der Algorithmus auf den Trainingsbildern getestet und die Ergebnisse mit den Referenzdaten verglichen. Als geeignetes Merkmal haben sich die Mittelwerte und Streuungen der Doppelbrechungsintensität der Zona pellucida erwiesen. Mit ihnen werden nach der Klassifikation, mit Hilfe des Nächste-Nachbar-Klassifikators, je nach Konfiguration (Einteilung der Zona in Ringe) zwischen 60% und 75% der Bilder der richtigen Klasse zugeordnet. Daraus lässt sich die Erkenntnis ableiten, dass das im Zuge dieser Arbeit entwickelte Verfahren einen guten Ansatz zur Klassifizierung einer Pferdeeizelle, in Bezug auf die weitere Entwicklung, durch die Analyse der Doppelbrechungsintensität in der Zona pellucida ermöglicht.
Abstract:
The agricultural faculty at Bonn University tried to analyze animal ovules on their further evolution, assisted by the Octax polarAIDE software which was developed for use in human medicine. For this purpose the ovules were positioned to be examined with a d petrological microscope and photographed with an assembled camera. An interpretation of the results gained however was not possible, as there were deficiently segmented zona pellucida as well as possibly unsuitable features. To gain data that could be interpreted it was necessary to improve segmentation of the zona pellucida to achieve qualified data for a classification. The realization of this is object for this Bachelor thesis. An approximate solution for the internal ellipse has been calculated by using differences in contrast within grayscale images of the ovule. For this purpose a threshold had to be detected which separated the cytoplasm from the zona pellucida. The attempt to improve the position of the ellipses by changing the ellipse parameter did not afford suitable results. For this reason the approximate solution was assumed as the best position.For segmentation of the external ellipse, the method for the alteration of the first derivative in the gradient image of an ovule was chosen. The resulting approximate solution lies outside the zona because of the unevenness appearing in the binary image. Thereupon these were edited by using an Erosion filter which led to an enhanced approximation of the external cover of the zona. To obtain attributes for classification of the ovule intensity of double refraction of the segmented zona was used. Hence the zona was fragmented in further rings which were subdivided in sectors over again. For identification of appropriate features several combinations of them were analyzed on their accuracy. For evaluation of the results the algorithm of sample images was tested and the conclusions were compared with the reference data. The midpoint and the dispersion of the intensity of double refraction of the zona proved as a proper feature. After classification with these features aided through the nearest-neighbour-classificator and depending on configuration (division of the zona in rings) between 60 to 75 per cent of the images were dedicated in the correct category. Hence the conclusion can be deduced that the procedures developed in the course of this study a promising approach for classification of a horse ovum concerning the further development by analyzing the intensity of double refraction in the zona.
[ BibTex ]
@MASTERSTHESIS{volkmann09:segmentierung,
author = "Volkmann, Thorsten",
title = "Segmentierung und Klassifikation von Oozytenbildern",
year = "2009",
school="Instiute of Photogrammetry, University of Bonn",
type="Bachelor Thesis",
}
2008
Jensen, Laura:
Automatische Detektion von Bombentrichtern
Bachelorarbeit, Bonn 2008
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Inform. Martin Drauschke download
14.0 M
[ Zusammenfassung ]
Der Kampfmittelbeseitigungsdienst der Bezirksregierung Arnsberg nutzt Luftbilder aus dem Zweiten Weltkrieg zur Detektion von Blindgängern. Aufgrund der großen Anzahl an Bildern (über 300000) ist die Suche sehr aufwändig. Die Arbeit der Auswerter könnte erleichtert werden, wenn sie eine Karte hätten, auf der die Dichte der Bombardierung dargestellt ist. Um diese Karte
zu erstellen, ist ein Verfahren notwendig, das die Bombentrichter auf den Bildern automatisch
detektiert. Dieses wurde in der vorliegenden Bachelorarbeit realisiert.
Da die Trichter sich in ihrer Gestalt und Größe stark unterscheiden, muss ein Ansatz zur Detektion gewählt werden, der mit diesen Variationen umgehen kann. Der Algorithmus führt eine Kandidatensuche mittels Kreuzkorrelation des Bildes mit einem repräsentativen Trichter-Template in verschiedenen Größen durch und klassifiziert die gefundenen Kandidaten anschließend. Die Klassifizierung erfolgt mit Hilfe der Wahrscheinlichkeitsdichte der Verteilungen der
Klassen Trichter und Hintergrund. Um die Verteilungsparameter zu schätzen, ist die Dimensionsreduktion
des Merkmalsraums der Trainingsdaten mit einer Hauptkomponentenanalyse (PCA)
und einer linearen Diskriminanzanalyse nach Fisher (LDA) und anschließender Projektion in den Unterraum notwendig. In dieser Arbeit wurde das Verfahren mit einer Trichterklasse implementiert, es kann aber gut auf verschiedene Trichterklassen erweitert werden.
Der Algorithmus zur Bombentrichterdetektion wurde in Matlab implementiert. Nach der Vorverarbeitung des Bildmaterials mussten zur Erstellung des Templates zunächst Trainingsbilder annotiert werden. Außerdem waren bei der Umsetzung verschiedene Parameter, wie z.B. die Templategrößen zur Kandidatensuche, die Dimension des PCA-Raums und die Bildausschnittsgröße bei der Klassifikation zu bestimmen.
Zur Beurteilung der Ergebnisse wurde der Algorithmus auf den Trainingsbildern getestet und die Ergebnisse mit den Referenzdaten verglichen. Je nachdem ob vier oder fünf Templategrößen verwendet werden, können mit dem erstellten Template etwa 75% oder 80% der Trichter erfasst werden. Nach der Klassifikation werden mit dem implementierten Algorithmus je nach Konfiguration zwischen 70% und 64% der Trichter detektiert, dabei ist die Relevanz allerdings sehr gering. Maximal sind etwa 31% der als Trichter klassifizierten Bildausschnitte auch tatsächlich Bombentrichter.
Bei der Analyse der false positives auf Testbildern ergab sich, dass bestimmte Bildstrukturen, wie Hausdächer, Schattenwurf an Straßen, Texturen in Feldern oder Waldstrukturen immer wieder
fälschlicherweise als Trichter klassifiziert werden. Bei der Untersuchung der nicht detektierten Bombentrichter konnten Trichterklassen abgeleitet werden, die mit dem erstellten Template nicht detektiert werden. Mit den Testbildern wurde außerdem die Möglichkeit untersucht, die Bilder mit Hilfe der Bombentrichterdetektion in die Kategorien schwache, mittlere und starke Bombardierung
einzuordnen. Hierbei wurden 73% der Bilder der richtigen Kategorie zugeordnet. Bei
einer Steigerung der Relevanz und der Annotation weiterer Testbilder ist eine bessere Einordnung zu erwarten.
Insgesamt liegt mit dieser Arbeit ein vielversprechender Ansatz zur Bombentrichterdetektion mit großer Erweiterungsmöglichkeit vor.
[ BibTex ]
MASTERSTHESIS@{jensen08:automatische,
author = "Jensen, Laura",
title = "Automatische Detektion von Bombentrichtern",
year = "2008",
school="Institute of Photogrammetry, University of Bonn",
type="Bachelor Thesis",
}
Muffert, Maximilian:
Durchführung von Untersuchungen zur Bewertung der Messqualität eines Faro-Messarms des Typs "Titanium"
Bachelorarbeit, Bonn 2008
Betreuung: Dr.-Ing. Wolfgang Schauerte, Prof. Dr.-Ing. Wolfgang Förstner In Zusammenarbeit mit dem Lehrstuhl für Geodäsie des IGG
[ Zusammenfassung ]
In the following study we carry out initial research on the FaroArm Titanium. The results allow conclusions regarding the accuracy and reliability of measurement depending on the measurement position. In order to draw conclusions about the accuracy we have developed and applied several measuring techniques.
The FaroArm Titanium (FaroArm) is a mobile precision measurement arm which can be described as an industrial robot. It has particular use in quality control and, in mechanical engineering in what is known as Reverse Engineering. In accordance with company specifications, single point accuracies of 0.05mm are achieved.
Mobile precision measurement arms consist of links various lengths which are usually connected bysix or seven revolute joints. The number ofthe axes ofrotation gives the number of degrees of freedom of the measurement arm. Company specifications regarding the lengths of the axes do not lie within the required range of accuracy. The orientation ofthe revolute joints is unknown.
In this study we deal with fundamental mathematical and statistical procedures for spatial orien¬tation. The Denavit-Hartenberg-Convention is of particular importance in robotic forward kinematics. The best estimation of spatial orientation is crucial in the measurements to be taken.
The main part of this study deals with the development and application of measurement concepts which will result in the first information about the accuracy of measurement ofthe FaroArm.
First we modelIed the forward kinematics of the robot by means of rough estimates of the axis length. A direct comparison between the self chosen coordinates and the nominal coordinates is impossible.
For results ofthe accuracy ofmeasurement, we compared the scatter plots ofthe FaroArm with reference scatter plots ofthe Lasertracker Smart 310 from the Leica Company. An exact definition of the points is therefore required, wh ich we have achieved by centring an aluminium plate. The plate has metal cylinders in which cones are inserted. The cones serve to define the points.
The different centring positions on the board were measured with both measuring systems. For both systems the spatial transformation between different plate positions were determined and compared. In this way we obtained our own information about measuring quality and accuracy ofthe FaroArm.
The comparison between the two different measuring systems reveals gross errors in the ovservations. These can be attributed to incorrect operation or uncertainty in the centring of the measuring plate. A direct outlier control has to be taken after every measurement.
[ BibTex ]
@MASTERSTHESIS{muffert08:durchfuehrung,
author = {Muffert, Maximilian},
title = {Durchführung von Untersuchungen zur Bewertung der Messqualität eines Faro-Messarms des Typs "Titanium},
school={University of Bonn},
type={Bachelor Thesis},
year = {2008},
}
Roscher, Ribana:
Lernen linearer probabilistischer diskriminativer Modelle für die semantische Bildsegmentierung
Diplomarbeit, Bonn 2008
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Ing. Filip Korč download
2.7 M
[ BibTex ]
@MASTERSTHESIS{roscher08:lernen,
author = "Roscher, Ribana",
title = "Lernen linearer probabilistischer diskriminativer Modelle für die semantische Bildsegmentierung",
year = "2008",
school="Institute of Photogrammetry, University of Bonn",
type="Diploma Thesis",
}
Schmeing, Benno:
Analyse des Bewegungsmusters von Objekten
Bachelorarbeit, Bonn 2008
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. Richard Steffen [ Zusammenfassung ]
Die vorliegende Arbeit beschäftigt sich mit der Analyse der Bewegungsmuster von Fußgängern. Wir entwickeln Methoden zur Erfassung, Modellierung und Klassifikation der Bewegung und untersuchen ihre Eignung an realen Daten. Für das implementierte Klassifikationsverfahren wählten wir einen diskriminativen Ansatz, d.h. Ziel der Klassifikation ist einzig die Unterscheidung verschiedener Bewegungsmuster. Auf die Realisierung eines generativen Ansatzes, der auch die Erzeugung synthetischer Bewegungsmuster erlaubt, wurde verzichtet. Der Algorithmus soll die Bewegungsmuster "Gehen", "Hinken" und "Laufen" anhand von Merkmalen unterscheiden, die aus der Eigenbewegung mehrerer Probanden
abgeleitet sind. Als Datengrundlage dienen mittels einer fest an der Brust angebrachten Kamera aufgenommene Rotationszeitreihen der Eigenbewegung der Probanden. Für jedes Bewegungsmuster stehen ca. 200 Videosequenzen von 5 Sekunden Länge (je 150 Bilder) zur Verfügung; die Rotationszeitreihen werden aus den Rotationen zwischen aufeinanderfolgenden Bildern erzeugt. Als Merkmalsvektoren für die Klassifikation dienen die Leistungsspektren der Rotationszeitreihen. Die Klassifikation basiert auf Fisher's Linearer Diskriminante. Dabei werden in der Trainingsphase die Merkmalsvektoren von 378 Bildfolgen bearbeitet. Im ersten Schritt findet eine Projektion in den Entscheidungsraum mittels Linearer Diskriminanzanalyse (LDA) statt. Die Projektion ist so gewählt, dass sich die Klassen im Entscheidungsraum maximal unterscheiden. Im zweiten Schritt wird die Verteilung der projizierten Datenpunkte für jede Klasse bestimmt. Eine zuvor durchgeführte Dimensionsreduktion mittels Hauptkompentenanalyse (PCA) reduziert die Dimension des Klassifikationsproblems und verbessert so die Numerik bei der LDA.
Nun können weitere Daten in den Entscheidungsraum projiziert und klassifiziert werden. Dabei wird jeder Datenpunkt der Klasse zugeordnet, bei der die Mahalonobis-Distanz zum Mittelpunkt der Klasse minimal ist.
Sowohl die Aufnahme der Bewegung als auch die Bestimmung der Rotationszeitreihen funktioniert unter den bei der Bachelorarbeit vorliegenden Bedingungen zuverlässig. Es kam allerdings bei der Bewegungsart "Laufen" bei 8 aus 200 Bildfolgen zu Fehlern bei der Rotationsbestimmung; diese Bildfolgen wurden aus der Datenmenge ausgeschieden.
Als Ergebnis der Trainingsphase ergaben sich neben der Projektionsmatrix in den Entscheidungsraum die Verteilungen der projizierten Trainingsdaten. Die Klassen sind im Entscheidungsraum gut unterscheidbar. Lediglich zwischen den Klassen "Gehen" und "Hinken" existieren Ausreißer, die nahe am Mittelwert der jeweils anderen Klasse liegen.
Der implementierte Algorithmus ist in der Lage, die einzelnen Bewegungsmuster zuverlässig zu entscheiden. Von 201 Testdatensätzen konnten 199 korrekt zugeordnet werden. Die Fehlzuordnungen traten zwischen den Klassen "Gehen" und ''Hinken'' auf.
Der zur Klassifikation der Bewegungsmuster verwendete Ansatz lässt sich gut auf die Analyse weiterer Bewegungsmuster ausweiten.
[ BibTex ]
@MASTERSTHESIS{schmeing08:analyse,
author = "Schmeing, Benno",
title = "Analyse des Bewegungsmusters von Objekten",
school="Instiute of Photogrammetry, University of Bonn",
type="Bachelor Thesis",
year = "2008",
}
Siegemund, Jan:
Trajektorienrekonstruktion von bewegten Objekten aus Stereobildfolgen
Diplomarbeit, Bonn 2008
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Prof. Dr. Daniel Cremers In Zusammenarbeit mit dem Institut für Informatik der Universität Bonn
(DAGM, SMI Young Researchers Award)
download
2.5 M
[ Zusammenfassung ]
Die vorliegende Arbeit beschäftigt sich mit der Rekonstruktion der räumlichen Trajektorienparameter
bewegter Objekte anhand von kalibrierten Stereobildsequenzen. Zur
Lösung dieses Problems wird ein Verfahren auf der Grundlage eines robusten Ausgleichungsmodells
eingeführt. Als Eingabedaten dienen vorsegmentierte Bildpunkte des
Objektes mit bekannter stereoskopischer und temporaler Zuordnung. Auf Basis dieser
Bildinformation wird zusätzlich zu den Trajektorienparametern eine dreidimensionale
Punktwolke in einem lokalen Objektsystem geschätzt, welche Hinweise auf Form und
Ausmaße des beobachteten Objektes liefert.
Darüber hinaus werden Techniken zur Steigerung der Effizienz und Robustheit des
Verfahrens vorgestellt und es wird erläutert, wie mögliches Vorwissen in den Ausgleichungsprozess
eingebracht werden kann.
Der Anwendungsfokus in Beispielen und Ergebnissen liegt auf der Bestimmung der
Trajektorien von Fremdfahrzeugen mittels Eigenfahrzeugsensorik zum Zwecke der Kollisionsvermeidung.
Diese Informationen sind für Fahrassistenzsysteme von großer Bedeutung
und für die Daimler AG als Kooperationspartner dieser Arbeit von besonderem
Interesse. Das Verfahren selbst wird jedoch auf kein spezielles Anwendungsgebiet beschr
änkt.
Anhand von Experimenten auf simulierten Szenen wird ein systematischer Fehler in
den geschätzten Objektpositionen beobachtet. Das Auftreten dieses Fehlers wird motiviert
und Methoden zur Behebung werden vorgestellt.Weiterhin zeigen Experimente auf
realen Aufnahmen die Notwendigkeit einer zeitlichen Glättung der geschätzten Trajektorienparameter.
Aus diesem Grund wird eine adaptive Glättungsmethode eingeführt,
deren Strenge darüber hinaus anwendungsbezogen gesteuert werden kann.
Die Ergebnisse zeigen, dass das Verfahren, trotz hoher Ausreißeranteile in den Eingabedaten,
im Stande ist, die Bewegungstrajektorie eines Objektes mit hoher Genauigkeit
und Robustheit zu bestimmen und gleichzeitig die dreidimensionale Form des beobachteten
Objektes zu rekonstruieren.
[ BibTex ]
@MASTERSTHESIS{siegemund08:trajektorienrekonstruktion,
author = "Siegemund, Jan",
title = "Trajektorienrekonstruktion von bewegten Objekten aus Stereobildfolgen",
year = "2008",
school="University of Bonn",
type="Diploma Thesis",
}
Steneberg, Stephan:
Robuste Relative Orientierung kalibrierter Kameras mit Bildkanten
Diplomarbeit, Bonn 2008
Betreuung: Dipl.-Inform. Timo Dickscheid, Prof. Dr.-Ing. Wolfgang Förstner In Zusammenarbeit mit der Arbeitsgruppe Aktives Sehen der Universität Koblenz
[ BibTex ]
@MASTERSTHESIS{steneberg08:robuste,
author = "Steneberg, Stephan",
title = "Robuste Relative Orientierung kalibrierter Kameras mit Bildkanten ",
year = "2008",
school="University of Bonn, University of Koblenz",
type="Diploma Thesis",
}
2007
De Sanctis, Federica:
Untersuchungen zur automatisierten Generierung von digitalen Oberflächenmodellen aus mehreren extrem großmaßstäbigen Luftbildern
Masterarbeit, Bonn 2007
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. Richard Steffen [ Zusammenfassung ]
Die vorliegende Arbeit untersucht zwei automatische Verfahren zur dichten Oberflächenrekonstruktion mit großmaßstäbigen Bildern. Dabei wird von einer bekannten inneren sowie äußere Orientierung ausgegangen. Die Verfahren liegen mit den Programmen MATCH-T der Firma Inpho GmbH sowie eine Implementation des Semi-Global-Matching Blockmatch vor. Insbesondere soll auf die zu erreichende Höhengenauigkeit aus Bildanordnungen für den Standard-Luftbildfall eingegangen werden.
[ BibTex ]
@MASTERTHESIS{de sanctis07:untersuchungen,
author = "De Sanctis, Federica",
title = "Untersuchungen zur automatisierten Generierung von digitalen Oberflächenmodellen aus mehreren extrem großmaßstäbigen Luftbildern",
year = "2007",
city = "Bonn",}
Fischer, Norbert:
3D-Reconstruction from Multiple Images on the GPU
Diplomarbeit, Bonn 2007
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, PD Dr. Volker Steinhage In Zusammenarbeit mit dem Institut für Informatik der Universität Bonn
[ Zusammenfassung ]
Die automatische Rekonstruktion der sichtbaren Oberfläche eines Objekts aus mehreren Bildern stellt ein in seiner Allgemeinheit ungelöstes Problem. Unter günstigen Bedingungen sind jedoch erfolgreiche Ansätze vorhanden. Die schnelle Implementation solcher Ansätze auf Graphischen Prozessoren (GPU's) stellt wegen der Entwicklung leistungsfähiger Schnittstellen und Programmiersprachen einen interessanten Ansatz dar. Dazu sind jedoch die Algorithmen auf ihre Parallelisierbarkeit zu untersuchen und zwar speziell in Bezug auf die von GPU's bereitgestellten Strukturen.
In der Arbeit soll ein Verfahren zur Oberflächenrekonstruktion in Hinblick auf seine Eignung für die Implementation auf einer GPU konzeptionell untersucht, prototypisch realisiert und untersucht werden.
[ BibTex ]
@DIPLOMA{fischer07:3d-reconstruction,
author = "Fischer, Norbert",
title = "3D-Reconstruction from Multiple Images on the GPU",
year = "2007",
city = "Bonn",}
Garvert, Christina:
Untersuchungen des SURF-Deskriptors zur Bildfolgenanalyse
Diplomarbeit, Bonn 2007
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. Richard Steffen [ Zusammenfassung ]
Im Forschungsbereich der gleichzeitigen Lokalisierung und Kartierung aus monokularen Bildfolgen ist das Verfolgen von Bildpunkten ein wesentlicher Bestandteil. Dies erfordert, dass die Bildpunkte in jedem Folgebild identifizierbar sind und nur geringe Disparitäten vorliegen. Abschattungen oder schnelle Rotationen der Kamera können den Verlust der Bildpunktverfolgung bedeuten.
In den letzten Jahren wurden verschiedene Deskriptoren zur Beschreibung der Punktumgebung entwickelt, mit denen es möglich ist, eine Zuordnung von Punkten auch bei extrem großen Disparitäten zu ermöglichen. Insbesondere rotations- und skaleninvariante Deskriptoren haben in den letzten Jahren massiv an Bedeutung gewonnen.
In der Diplomarbeit soll der von Bay et al. (2006) vorgestellte rotations- und skaleninvariante Punktdeskriptor SURF implementiert werden. Im Gegensatz zum Sift Deskriptor von Lowe (2004) werden beim SURF-Deskriptor Integral-Bilder zur wesentlich schnelleren Berechnung verwendet. In der Arbeit soll untersucht werden, welche Parameter des Punktdeskriptors Genauigkeit und Geschwindigkeit beeinflussen. Da der Deskriptor auf einer anderen Art von Punktmerkmalen basiert, soll überprüft werden, bei welchen Typen von Bilddaten der SURF Deskriptor zum Sift-Deskriptor über- bzw. unterlegen ist. Der SURF Deskriptor soll an künstlichen Daten und wenn möglich an realen Daten (Luftbilder) getestet und evaluiert werden.
[ BibTex ]
@DIPLOMA{garvert07:untersuchungen,
author = "Garvert, Christina",
title = "Untersuchungen des SURF-Deskriptors zur Bildfolgenanalyse",
year = "2007",
city = "Bonn",}
Grau, Stephan:
Untersuchungen zur Rekonstruktion von Bohrungen aus Stereobildern
Diplomarbeit, Bonn 2007
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. Richard Steffen [ Zusammenfassung ]
In der Industrie werden stereoskopische Messtechniken zur Prüfung von Werkstücken bereits erfolgreich eingesetzt. Dabei werden höchste Anforderungen an die Genauigkeit gestellt. Insbesondere metallene Oberflächen stellen durch ihr schwer vorhersehbares Reflektionsverhalten eine besondere Herausforderung dar. Eine Oberflächenrekonstruktion wird heute im Allgemeinen punktweise durch Einsatz von strukturiertem Licht gelöst. Damit werden zwar hoch genau Oberflächen vermessen, jedoch bleibt die Bestimmung von präzisen Koordinaten von Bohrlöchern ein bisher ungelöstes Problem.
Diese Diplomarbeit setzt sich zum Ziel, die Position eines mit einem Stereosystem beobachteten Bohrlochs (Kreis im Raum) im photogrammetrischen System präzise zu bestimmen. Grundlage der Rekonstruktion sind subpixelgenaue Kanten des Bohrlochs. Dabei treten auch Kanten aus Spiegelungen auf. In einem ersten Schritt soll untersucht werden, wie Näherungswerte bestimmt werden können. In einem zweiten Schritt ist ein robustes Ausgleichsmodell zu realisieren. Es soll untersucht werden, unter welchen Bedingungen welche Genauigkeiten der Rekonstruktion der Bohrloch-Koordinate erreicht werden können.
[ BibTex ]
@DIPLOMA{grau07:untersuchungen,
author = "Grau, Stephan",
title = "Untersuchungen zur Rekonstruktion von Bohrungen aus Stereobildern",
year = "2007",
city = "Bonn",}
Herms, Kerstin:
Exploration des Skalenraumes bezüglich der Gebäudeextraktion in terrestrischen Farbbildern
Diplomarbeit, Bonn 2007
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Inform. Martin Drauschke download
12.9 M
[ Zusammenfassung ]
Die Gebäudedetektion in digitalen Bildern stellt wegen der Komplexität der Objekte ein schwieriges Problem der Mustererkennung dar. In neueren Ansätzen zur Gebäudeextraktion wird das Bild in verschiedenen Auflösungsstufen, im sog. Skalenraum analysiert. Auf diese Weise können für die Bildinterpretation hinderliche Details ausgeblendet werden. Dabei spielen stabile Regionen, d. s. Regionen die sich bei Veränderung der Auflösung wenig ändern, eine besondere Rolle. Von stabilen Regionen im Skalenraum kann man auf kontraststarke Übergänge zwischen Objekten im Bild schließen [Drauschke et al. 2006: Stabilität von Regionen im Skalenraum].
Diese Diplomarbeit soll untersuchen, ob über stabilen Bildregionen eine Klassifikation von Gebäuden und anderen Objekten durchgeführt werden kann. Dazu sollen Merkmale der stabilen Regionen ausgewählt und bestimmt werden und diese Merkmale auf ihre Skalenabhängigkeit hin überprüft werden. Mit Hilfe eines geeignet gewählten Klassifikators sollen Gebäude und andere Objekte identifiziert werden. An Hand von terrestrischen Bildern soll bewertet werden, ob die u. U. skalenabhängigen Merkmale für die Gebäudeextraktion geeignet sind.
[ BibTex ]
@DIPLOMA{herms07:exploration,
author = "Herms, Kerstin",
title = "Exploration des Skalenraumes bezüglich der Gebäudeextraktion in terrestrischen Farbbildern",
year = "2007",
city = "Bonn",}
Klughardt, Frank:
Einführung eines neuen Photokonsistenz-Maßes zur Oberflächenrekonstruktion in Luftbildern mittels eines Multilabel-Graphcut-Verfahrens
Diplomarbeit, Bonn 2007
Betreuung: Prof. Dr. Daniel Cremers, Prof. Dr.-Ing. Wolfgang Förstner In Zusammenarbeit mit dem Institut für Informatik der Universität Bonn
[ Zusammenfassung ]
Die Zuordnung von Bildern im Rahmen einer dreidimensionalen Rekonstruktion der abgebildeten Szene stellt in seiner Allgemeinheit ein bisher - im Vergleich zum visuellen System des Menschen - nur sehr unzureichend gelöstes Problem dar. Gleichzeitig gibt es eine große Zahl erfolgreicher Ansätze zur Lösung des Problems unter wohl definierten Bedingungen und eine beträchtliche Zahl in der Praxis angewendeter Verfahren. Die Rekonstruktion von Oberflächenmodellen aus Luftbildern stellt eine in jüngster Zeit mit den Entwicklungen von Google-Earth and Virtual Earth zunehmend beachtete Problemstellung dar. Die Randbedingungen für eine Stereorekonstruktion sind hier wegen der meist günstig gewählten Lichtverhältnisse bei der Bildaufnahme und der meist vorhandenen diffusen Reflexionseigenschaften der Oberflächen vergleichsweise homogen, wenn man von Schatteneffekten und gelegentlichen spiegelnden Reflektionen absieht.
Das in diesem Bereich übliche Maß zur Kennzeichnung der Ähnlichkeit zugeordneter Bildbereiche sind der normalisierte Korrelationskoeffizient und die Summe der quadratischen Intensitätsdifferenzen. Die beiden Maße stellen Extreme bzgl. der Invarianz gegen Beleuchtungsveränderung dar: Der Korrelationskoeffizient ist völlig invariant, die Summe der quadratischen Intensitätsdifferenzen nicht invariant. Das zentrale Anliegen der vorliegenden Arbeit ist die Entwicklung eines neuen Photokonsistenzmaßes, das zwischen diesen bei den Extremen zu vermitteln in der Lage ist. Für eine genäherte Oberflächenrekonstruktion wird das Multi-Level-Graphcut-Verfahren eingesetzt, das vergleichsweise effizient das komplexe Problem der Oberflächenrekonstruktion lösen kann und das neben dem neuen Photokonsistenzmaß flexibel Vorinformation über die Oberfläche integrieren und so das Problem von Unstetigkeiten angehen kann.
[ BibTex ]
@DIPLOMA{klughardt07:einführung,
author = "Klughardt, Frank",
title = "Einführung eines neuen Photokonsistenz-Maßes zur Oberflächenrekonstruktion in Luftbildern mittels eines Multilabel-Graphcut-Verfahrens",
year = "2007",
city = "Bonn",}
Schmitz, Cornelia:
Untersuchungen zur Genauigkeit der gleichzeitigen Lokalisierung und Kartierung aus monokularen Bildfolgen
Diplomarbeit, Bonn 2007
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. Richard Steffen [ BibTex ]
@DIPLOMA{schmitz07:untersuchungen,
author = "Schmitz, Cornelia",
title = "Untersuchungen zur Genauigkeit der gleichzeitigen Lokalisierung und Kartierung aus monokularen Bildfolgen",
year = "2007",
city = "Bonn",}
Zug, Laura:
Untersuchungen zur Genauigkeit der automatischen Punkt- und Orientierungsbestimmung aus extrem großmaßstäbigen Luftbildern
Masterarbeit, Bonn 2007
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. Richard Steffen [ Zusammenfassung ]
Die vorliegende Arbeit untersucht die durch ein vollautomatisches Orientierungsverfahren (Läbe & Förstner) erreichbaren Genauigkeiten eines Bildverbanders anhand der Genauigkeit rekonstruierter Objektpunkt-koordinaten. Für diese liegen aus einer unabhängigen terrestrischen Messung genaue Referenzkoordinaten vor. Zum Vergleich der Wiedersprüche zwischen Referenzkoordinaten und rekonstruierter Koordinaten in einem photogrammetrischen Modell sollte in der Arbeit eine Koordinatentransformation basierend auf der K- und S-Transformation erstellt werden.
[ BibTex ]
@PHDTHESIS{zug07:untersuchungen,
author = "Zug, Laura",
title = "Untersuchungen zur Genauigkeit der automatischen Punkt- und Orientierungsbestimmung aus extrem großmaßstäbigen Luftbildern",
year = "2007",
city = "Bonn",}
2006
Dickscheid, Timo:
Markerlose Selbstlokalisation durch Fusion von Sensordaten
Diplomarbeit, Bonn 2006
Betreuung: Prof. Dr.-Ing. Dietrich Paulus (Universität Koblenz), Dr.-Ing. Chunrong Yuan (Fraunhofer FIT) [ BibTex ]
@DIPLOMA{dickscheid06:markerlose,
author = "Dickscheid, Timo",
title = "Markerlose Selbstlokalisation durch Fusion von Sensordaten",
year = "2006",
city = "Bonn",}
Hellwich, Hendrik:
Bestimmung der Eigenbewegung anhand einer monokularen Bildfolge
Diplomarbeit, Bonn 2006
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. Richard Steffen In Zusammenarbeit mit dem Institut für Informatik der Universität Bonn
[ BibTex ]
@DIPLOMA{hellwich06:bestimmung,
author = "Hellwich, Hendrik",
title = "Bestimmung der Eigenbewegung anhand einer monokularen Bildfolge",
year = "2006",
city = "Bonn",}
Kesting, Arne:
Bild-basierte Baumkronenmodellierung mit Kugelflächenfunktionen
Diplomarbeit, Bonn 2006
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Inform. Christian Beder [ BibTex ]
@DIPLOMA{kesting06:bild-basierte,
author = "Kesting, Arne",
title = "Bild-basierte Baumkronenmodellierung mit Kugelflächenfunktionen",
year = "2006",
city = "Bonn",}
Thielmann, Jan:
Entwurf und Evaluierung eines Verfahrens zur Detektion wiederholter Bildstrukturen
Diplomarbeit, Bonn 2006
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Inform. Martin Drauschke [ Zusammenfassung ]
Wiederholte Strukturen sind charakteristisch für künstliche Objekte, verursachen jedoch gleichzeitig für Zuordnungsverfahren eine sehr hohe algorithmische Komplexität, weshalb Verfahren zur Identifikation wiederholter Strukturen von besonderem Interesse sind. In der Arbeit soll das verfahren von Schaffalitzky und Zisserman (2000) auf seine Eignung für die Detektion wiederholter Strukturen in Bildern von Gebäuden untersucht und bewertet werden.
[ BibTex ]
@DIPLOMA{thielmann06:entwurf,
author = "Thielmann, Jan",
title = "Entwurf und Evaluierung eines Verfahrens zur Detektion wiederholter Bildstrukturen",
year = "2006",
city = "Bonn",}
Wenzel, Susanne:
Detektion wiederholter und symmetrischer Strukturen von Objekten in Bildern
Diplomarbeit, Bonn 2006
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Inform. Martin Drauschke download
18.5 M
[ Zusammenfassung ]
Sich wiederholende bzw. symmetrische Strukturen sind Hinweise auf künstliche Objekte, führen aber auch zu Schwierigkeiten bei klassischen Bildzuordnungsverfahren. Die Suche und Gruppierung zusammengehöriger Features kann daher zur Identifikation künstlicher Objekte oder zur Verbesserung von Zuordnungsverfahren dienen. Darüber hinaus kann man aus einem Bild eines im Raum symmetrischen Objekts auf die 3D-Struktur dieses Objekts schließen.
Die Diplomarbeit soll das von Loy und Eklundh auf der ECCV 2006 vorgestellte Verfahren zur
Detektion symmetrischer und wiederholter Bildbereiche implementieren und hinsichtlich seiner Verwendbarkeit für photogrammetrische Gebäudeaufnahmen überprüfen. Insbesondere geht es um die Detektierbarkeit regelmäßiger Fassadenstrukturen in Abhängigkeit von ihrer Komplexität. Darüber hinaus ist zu klären, wie mehrfache Symmetrien identifiziert und ggf. für die 3D-Rekonstruktion des regelmäßigen Teils der Fassadenstruktur genutzt werden können.
[ BibTex ]
@DIPLOMA{wenzel06:detektion,
author = "Wenzel, Susanne",
title = "Detektion wiederholter und symmetrischer Strukturen von Objekten in Bildern",
year = "2006",
city = "Bonn",}
2005
Krömeke, Sven:
Extraktion affininvarianter Bildmerkmale
Diplomarbeit, Bonn 2005
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, PD Dr. Volker Steinhage In Zusammenarbeit mit dem Institut für Informatik der Universität Bonn
[ BibTex ]
@DIPLOMA{krömeke05:extraktion,
author = "Krömeke, Sven",
title = "Extraktion affininvarianter Bildmerkmale",
year = "2005",
city = "Bonn",}
Wellen, Thomas:
Shadow Removal from Aerial Views for Realistic Terrain Rendering
Diplomarbeit, Bonn 2005
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Prof. Dr. Reinhard Klein In Zusammenarbeit mit dem Institut für Informatik der Universität Bonn
[ BibTex ]
@DIPLOMA{wellen05:shadow,
author = "Wellen, Thomas",
title = "Shadow Removal from Aerial Views for Realistic Terrain Rendering",
year = "2005",
city = "Bonn",}
2004
Dickscheid, Timo:
Automatische Referenzpunktverfeinerung in Panoramabildern mittels SIFT-Operator
Bachelorarbeit, Bonn 2004
Betreuung: Dipl.-Inf. Detlev Droege, Studienarbeit
[ BibTex ]
@{dickscheid04:automatische,
author = "Dickscheid, Timo",
title = "Automatische Referenzpunktverfeinerung in Panoramabildern mittels SIFT-Operator",
year = "2004",
city = "Bonn",}
Thöle, Markus:
Evaluierung verschiedener Ansätze zur Schätzung und Repräsentation unsicherer Geraden im Raum
Diplomarbeit, Bonn 2004
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. Marc Luxen [ BibTex ]
@DIPLOMA{thöle04:evaluierung,
author = "Thöle, Markus",
title = "Evaluierung verschiedener Ansätze zur Schätzung und Repräsentation unsicherer Geraden im Raum",
year = "2004",
city = "Bonn",}
2002
Beder, Christian:
An Optimisation Method for Obtaining the Fundamental Matrix from an Image Pair
Diplomarbeit, Bonn 2002
Betreuung: Prof. Dr. Joachim Buhmann, Prof. Dr.-Ing. Wolfgang Förstner In Zusammenarbeit mit dem Institut für Informatik der Universität Bonn
[ Zusammenfassung ]
Die Bestimmung der relativen Lage zweier Kameras zum Zeitpunkt der Aufnahmen, die sog. relative Orientierung der Bilder, stellt ein klassisches Problem der Photogrammetrie dar und ist Grundlage jeder Auswertung von Stereobildpaaren. Eine vollautomatische allgemeine Lösung dieses Problems existiert bisher nicht. Grund ist die Schwierigkeit, homologe Bilddetails, die sich auf denselben Objektpunkt beziehen, automatisch und unter beliebigen unbekannten Perspektiven zu finden. Sobald homologe Punkte vorliegen, existieren klassische Verfahren zur Bestimmung der sog. Fundamentalmatrix, die die gesamte Information der relativen Orientierung zweier geradentreu abbildender Kameras enthält.
Die Fundamentalmatrix ermöglicht insbesondere die Formulierung eines geometrischen Kriteriums für Punkte, die sog. Koplanaritätsbedingung. Als zweites Kriterium für die Homologie von Punkten verwendet man ein radiometrisches Kriterium, meist die Ähnlichkeit der Intensitäts- oder Farbverteilung in der Umgebung der Punkte. Sie ist jedoch nur unter eingeschränkten Bedingungen leicht zu bestimmen, nicht etwa bei partiellen Verdeckungen.
Ziel der Arbeit ist nun die Bestimmung der Fundamentalmatrix als Optimierungsverfahren zu formulieren, das gelichzeitig die geometrischen und die radiometrischen Bedingungen berücksichtigt. Intensitätsunterschiede und Abweichungen von der Koplanaritätsbedingung werden durch die Formulierung von normierten chi-quadrat-verteilten Distanzmaßen integriert. Dabei werden die Umgebungen homologer Punkte maßstabs- und rotationsinvariant verglichen. Die Zuordnung wird mit einem Annealingverfahren bestimmt. Die Leistungsfähigkeit und die Grenzen des Verfahrens wird an hand eines künstlichen Beispiels, für das die wahren Werte der Fundamentalmatrix bekannt sind, demonstriert.
[ BibTex ]
@DIPLOMA{beder02:optimisation,
author = "Beder, Christian",
title = "An Optimisation Method for Obtaining the Fundamental Matrix from an Image Pair",
year = "2002",
city = "Bonn",}
Borchert, Konstantin / Kokossulis, Hubert / Müller, Gero:
3D-Rekonstruktion aus Videosequenzen
Diplomarbeit, Bonn 2002
Betreuung: Prof. Dr. Reinhard Klein, Prof. Dr.-Ing. Wolfgang Förstner In Zusammenarbeit mit dem Institut für Informatik der Universität Bonn
[ BibTex ]
@DIPLOMA{borchert*02:3d-rekonstruktion,
author = "Borchert, Konstantin and Kokossulis, Hubert and Müller, Gero",
title = "3D-Rekonstruktion aus Videosequenzen",
year = "2002",
city = "Bonn",}
Schuster, Hanns-Florian:
Bildsegmentierung mit stochastischen Bildpyramiden
Diplomarbeit, Bonn 2002
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dr.-Ing. Ansgar Brunn [ Zusammenfassung ]
Die Bildsegmentierung ist ein unverzichtbarer Schritt zur Vorverarbeitung von Bildern für die Objekterkennung. Die Stochastische Bildpyramide ist ein hierarchischer Ansatz der Segmentierung, der auf einer durch einen Zufallsprozess gesteuerten, unregelmäßigen Pyramide beruht.
Aufgabe des Diplomanden ist es, die theoretischen Grundlagen der stochastischen Bildpyramide aufzuarbeiten und zu untersuchen, in wieweit sich diese Struktur in Verbindung mit etablierten Segmentierungsalgorithmen zur Bildsegmentierung einsetzen läßt.
[ BibTex ]
@DIPLOMA{schuster02:bildsegmentierung,
author = "Schuster, Hanns-Florian",
title = "Bildsegmentierung mit stochastischen Bildpyramiden",
year = "2002",
city = "Bonn",}
2001
Blau, Fabian / Germer, Peter:
Verfahren zur 3D-Rekoonstruktion von Zylindern aus digitalen Bildern und dessen Beurteilung
Diplomarbeit, Bonn 2001
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Inform. Stephan Heuel [ BibTex ]
@DIPLOMA{blau*01:verfahren,
author = "Blau, Fabian and Germer, Peter",
title = "Verfahren zur 3D-Rekoonstruktion von Zylindern aus digitalen Bildern und dessen Beurteilung",
year = "2001",
city = "Bonn",}
Kühnhenrich, Karin:
Wavelet-Transformation zur Repräsentation von diskreten Signalen
Diplomarbeit, Bonn 2001
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dr.-Ing. Ansgar Brunn [ BibTex ]
@DIPLOMA{kühnhenrich01:wavelet-transformation,
author = "Kühnhenrich, Karin",
title = "Wavelet-Transformation zur Repräsentation von diskreten Signalen",
year = "2001",
city = "Bonn",}
2000
Boxhammer, Christian:
Effizienz der Methode der konjugierten Gradienten bei der Rekonstruktion von Oberflächen aus digitalen Bildern
Diplomarbeit, Bonn 2000
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dr.-Ing. Jochen Meidow [ BibTex ]
@DIPLOMA{boxhammer00:effizienz,
author = "Boxhammer, Christian",
title = "Effizienz der Methode der konjugierten Gradienten bei der Rekonstruktion von Oberflächen aus digitalen Bildern",
year = "2000",
city = "Bonn",}
Graeff, Bastian:
Mehrbildzuordnung von projektiv verzerrten Bildern für die Qualitätsbewertung von Bildanalyseprozessen
Diplomarbeit, Bonn 2000
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, [ BibTex ]
@DIPLOMA{graeff00:mehrbildzuordnung,
author = "Graeff, Bastian",
title = "Mehrbildzuordnung von projektiv verzerrten Bildern für die Qualitätsbewertung von Bildanalyseprozessen",
year = "2000",
city = "Bonn",}
Luxen, Marc:
Der EM-Algorithmus bei Schätz- und Klassifikationsverfahren
Diplomarbeit, Bonn 2000
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. Ansgar Brunn [ BibTex ]
@DIPLOMA{luxen00:em-algorithmus,
author = "Luxen, Marc",
title = "Der EM-Algorithmus bei Schätz- und Klassifikationsverfahren",
year = "2000",
city = "Bonn",}
Schmalkoke, Peter:
Bestimmung der Eigenbewegung eines Stereo-Kamera-Systems auf der Grundlage quasi-kontinuierlicher Bilddatenauswertung
Diplomarbeit, Bonn 2000
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. Ansgar Brunn [ BibTex ]
@DIPLOMA{schmalkoke00:bestimmung,
author = "Schmalkoke, Peter",
title = "Bestimmung der Eigenbewegung eines Stereo-Kamera-Systems auf der Grundlage quasi-kontinuierlicher Bilddatenauswertung",
year = "2000",
city = "Bonn",}
1999
Kort, Alexander:
Modellbasierte Gebäudeerkennung in Luftbildern
Diplomarbeit, Bonn 1999
Betreuung: Prof. Dr. Armin B. Cremers, Prof. Dr.-Ing. Wolfgang Förstner In Zusammenarbeit mit dem Institut für Informatik der Universität Bonn
[ BibTex ]
@DIPLOMA{kort99:modellbasierte,
author = "Kort, Alexander",
title = "Modellbasierte Gebäudeerkennung in Luftbildern",
year = "1999",
city = "Bonn",}
1998
Fehlis, Hendrik:
Ein videometrisches 6D-Trackingverfahren für den Einsatz in Virtuellen Studios
Diplomarbeit, Bonn 1998
Betreuung: Prof. Dr. Armin B. Cremers, Prof. Dr.-Ing. Wolfgang Förstner In Zusammenarbeit mit dem Institut für Informatik der Universität Bonn
[ BibTex ]
@DIPLOMA{fehlis98:ein,
author = "Fehlis, Hendrik",
title = "Ein videometrisches 6D-Trackingverfahren für den Einsatz in Virtuellen Studios",
year = "1998",
city = "Bonn",}
Heinen, Holger:
Automatische Bestimmung der Kameralage von Legoland-Bildern
Diplomarbeit, Bonn 1998
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. Steffen Abraham [ BibTex ]
@DIPLOMA{heinen98:automatische,
author = "Heinen, Holger",
title = "Automatische Bestimmung der Kameralage von Legoland-Bildern",
year = "1998",
city = "Bonn",}
Kastenholz, Bernd:
Ein hierarchisches Konzept zur Artenidentifikation von Wildbienen durch morphologische Bildanalyse
Diplomarbeit, Bonn 1998
Betreuung: Prof. Dr. Armin B. Cremers, Prof. Dr.-Ing. Wolfgang Förstner In Zusammenarbeit mit dem Institut für Informatik der Universität Bonn
[ BibTex ]
@DIPLOMA{kastenholz98:ein,
author = "Kastenholz, Bernd",
title = "Ein hierarchisches Konzept zur Artenidentifikation von Wildbienen durch morphologische Bildanalyse",
year = "1998",
city = "Bonn",}
Kummer, Sönke:
Qualitätsbewertung photogrammetrisch erfaßter Geodaten
Diplomarbeit, Bonn 1998
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dr.-Ing. Eberhard Gülch [ BibTex ]
@DIPLOMA{kummer98:qualitätsbewertung,
author = "Kummer, Sönke",
title = "Qualitätsbewertung photogrammetrisch erfaßter Geodaten",
year = "1998",
city = "Bonn",}
Steines, Bernd:
Bewegungsschätzung aus Bildtripeln
Diplomarbeit, Bonn 1998
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. Steffen Abraham [ BibTex ]
@DIPLOMA{steines98:bewegungsschätzung,
author = "Steines, Bernd",
title = "Bewegungsschätzung aus Bildtripeln",
year = "1998",
city = "Bonn",}
1997
Bank, Martin:
Entwicklung eines Merkmalszuordnungsverfahrens zur Orientierung von Bildern künstlicher Objekte
Diplomarbeit, Bonn 1997
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. Thomas Hau [ BibTex ]
@DIPLOMA{bank97:entwicklung,
author = "Bank, Martin",
title = "Entwicklung eines Merkmalszuordnungsverfahrens zur Orientierung von Bildern künstlicher Objekte",
year = "1997",
city = "Bonn",}
Busch, Thomas:
Zur Eignung eines CAD-Systems für die Erfassung, Verwaltung, Analyse und Präsentation von Geometrie- und Sachdaten
Diplomarbeit, Bonn 1997
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dr.-Ing. Stephan Winter [ BibTex ]
@DIPLOMA{busch97:zur,
author = "Busch, Thomas",
title = "Zur Eignung eines CAD-Systems für die Erfassung, Verwaltung, Analyse und Präsentation von Geometrie- und Sachdaten",
year = "1997",
city = "Bonn",}
Ernst, Heike:
Photogrammetric Mensuration of Water Surfaces
Diplomarbeit, Bonn 1997
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Prof. Ingolf Hadem In Zusammenarbeit mit dem Department of Surveying and Mapping der Norwegian University of Science and Technology in Trondheim
[ BibTex ]
@DIPLOMA{ernst97:photogrammetric,
author = "Ernst, Heike",
title = "Photogrammetric Mensuration of Water Surfaces",
year = "1997",
city = "Bonn",}
Heuel, Stephan:
Duale, skalierbare und hierarchische Partionierung und Gruppierung von Binärfiguren
Diplomarbeit, Bonn 1997
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Prof. Dr. Joachim Buhmann In Zusammenarbeit mit dem Institut für Informatik der Universität Bonn
[ BibTex ]
@DIPLOMA{heuel97:duale,,
author = "Heuel, Stephan",
title = "Duale, skalierbare und hierarchische Partionierung und Gruppierung von Binärfiguren",
year = "1997",
city = "Bonn",}
Jans, Sönke / Kindermann, Jürgen:
Objektrekonstruktion durch Bildfolgenanalyse
Diplomarbeit, Bonn 1997
Betreuung: Prof. Dr. Armin B. Cremers, Prof. Dr.-Ing. Wolfgang Förstner In Zusammenarbeit mit dem Institut für Informatik der Universität Bonn
[ BibTex ]
@DIPLOMA{jans*97:objektrekonstruktion,
author = "Jans, Sönke and Kindermann, Jürgen",
title = "Objektrekonstruktion durch Bildfolgenanalyse",
year = "1997",
city = "Bonn",}
1996
Dickel, Hartmut:
Untersuchung der robusten Schätzung der relativen Orientierungselemente
Diplomarbeit, Bonn 1996
Betreuung: Dr.-Ing. Karl-Heiko Ellenbeck, Prof. Dr.-Ing. Wolfgang Förstner [ BibTex ]
@DIPLOMA{dickel96:untersuchung,
author = "Dickel, Hartmut",
title = "Untersuchung der robusten Schätzung der relativen Orientierungselemente",
year = "1996",
city = "Bonn",}
Fischer, André:
Zur analytischen Herleitung von Aspektgraphen
Diplomarbeit, Bonn 1996
In Zusammenarbeit mit dem Institut für Informatik der Universität Bonn
[ BibTex ]
@DIPLOMA{fischer96:zur,
author = "Fischer, André",
title = "Zur analytischen Herleitung von Aspektgraphen",
year = "1996",
city = "Bonn",}
Gallrein, Volkmar:
Bildkalibrierung zur erzeugung von Doppler-Global-Velocimeter Geschwindigkeitsbildern
Diplomarbeit, Bonn 1996
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Prof. Dr. Armin B. Cremers In Zusammenarbeit mit dem Institut für Antriebstechnik der DLR und dem Institut für Informatik der Universität Bonn
[ BibTex ]
@DIPLOMA{gallrein96:bildkalibrierung,
author = "Gallrein, Volkmar",
title = "Bildkalibrierung zur erzeugung von Doppler-Global-Velocimeter Geschwindigkeitsbildern",
year = "1996",
city = "Bonn",}
Jäger, Dagmar:
Segmentierung triangulierter Flächen
Diplomarbeit, Bonn 1996
In Zusammenarbeit mit dem Institut für Informatik der Universität Bonn
[ BibTex ]
@DIPLOMA{jäger96:segmentierung,
author = "Jäger, Dagmar",
title = "Segmentierung triangulierter Flächen",
year = "1996",
city = "Bonn",}
Kaufmann, Norbert:
Zuordnung von Knotenstrukturen für die Gebäuderekonstruktion
Diplomarbeit, Bonn 1996
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, In Zusammenarbeit mit dem Institut für Informatik der Universität Bonn
[ BibTex ]
@DIPLOMA{kaufmann96:zuordnung,
author = "Kaufmann, Norbert",
title = "Zuordnung von Knotenstrukturen für die Gebäuderekonstruktion",
year = "1996",
city = "Bonn",}
1995
Becker, Ralf:
Untersuchung von ID3 zur Klassifikation von Bildmerkmalen
Diplomarbeit, Bonn 1995
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. Felicitas Lang [ BibTex ]
@DIPLOMA{becker95:untersuchung,
author = "Becker, Ralf",
title = "Untersuchung von ID3 zur Klassifikation von Bildmerkmalen",
year = "1995",
city = "Bonn",}
Brandes, Ulf:
Rekonstruktion bewegter Wasseroberflächen anhand ihrer lichtbrechenden Wirkung
Diplomarbeit, Bonn 1995
Betreuung: Prof. Klaus Heinloth, Prof. Dr.-Ing. Wolfgang Förstner In Zusammenarbeit mit dem Physikalischen Institut der Universität Bonn
[ BibTex ]
@DIPLOMA{brandes95:rekonstruktion,
author = "Brandes, Ulf",
title = "Rekonstruktion bewegter Wasseroberflächen anhand ihrer lichtbrechenden Wirkung",
year = "1995",
city = "Bonn",}
Fitz, Helmut:
Kantenextraktion mittels Dynamischer Programmierung
Diplomarbeit, Bonn 1995
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Prof. Dr. Veenker In Zusammenarbeit mit dem Institut für Informatik der Universität Bonn
[ BibTex ]
@DIPLOMA{fitz95:kantenextraktion,
author = "Fitz, Helmut",
title = "Kantenextraktion mittels Dynamischer Programmierung",
year = "1995",
city = "Bonn",}
Kulschewski, Kai:
Verfahren zur robusten Schätzung der relativen Orientierungselemente
Diplomarbeit, Bonn 1995
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. Wolfgang Schickler [ BibTex ]
@DIPLOMA{kulschewski95:verfahren,
author = "Kulschewski, Kai",
title = "Verfahren zur robusten Schätzung der relativen Orientierungselemente",
year = "1995",
city = "Bonn",}
Pospiech, Michael:
Extraktion von Gebäudeumrissen aus hochauflösenden Digitalen Höhenmodellen
Diplomarbeit, Bonn 1995
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. Uwe Weidner [ BibTex ]
@DIPLOMA{pospiech95:extraktion,
author = "Pospiech, Michael",
title = "Extraktion von Gebäudeumrissen aus hochauflösenden Digitalen Höhenmodellen",
year = "1995",
city = "Bonn",}
Scheuß, Ulrich:
Entwicklung eines autonomen Kalibrierungsverfahrens für das Stereokamerasystem eines Roboters
Diplomarbeit, Bonn 1995
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Prof. Dr. Joachim Buhmann In Zusammenarbeit mit dem Institut für Informatik der Universität Bonn
[ BibTex ]
@DIPLOMA{scheuß95:entwicklung,
author = "Scheuß, Ulrich",
title = "Entwicklung eines autonomen Kalibrierungsverfahrens für das Stereokamerasystem eines Roboters",
year = "1995",
city = "Bonn",}
Wydera, Markus:
Automatische Bestimmung von Fluchtpunkten
Diplomarbeit, Bonn 1995
Betreuung: Dr.-Ing. Carola Braun, Prof. Dr.-Ing. Wolfgang Förstner [ BibTex ]
@DIPLOMA{wydera95:automatische,
author = "Wydera, Markus",
title = "Automatische Bestimmung von Fluchtpunkten",
year = "1995",
city = "Bonn",}
1994
Kosarek, Armin:
Analyse ausgezeichneter Lagebeziehungen geometrischer Grundelemente
Diplomarbeit, Bonn 1994
Betreuung: Prof. Dr.-Ing. Förstner, Dipl.-Ing. Gisela Ditze [ BibTex ]
@DIPLOMA{kosarek94:analyse,
author = "Kosarek, Armin",
title = "Analyse ausgezeichneter Lagebeziehungen geometrischer Grundelemente",
year = "1994",
city = "Bonn",}
Lühring, Hajo:
Radiometrische Kalibrierung der CCD-Kamera am Analytischen Auswertegerät Planicomp P 3
Diplomarbeit, Bonn 1994
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. Claudia Fuchs [ BibTex ]
@DIPLOMA{lühring94:radiometrische,
author = "Lühring, Hajo",
title = "Radiometrische Kalibrierung der CCD-Kamera am Analytischen Auswertegerät Planicomp P 3",
year = "1994",
city = "Bonn",}
Wittich, Christian:
Interaktive Extraktion von Satteldächern aus Digitalen Luftbildern
Diplomarbeit, Bonn 1994
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. Gisela Ditze [ BibTex ]
@DIPLOMA{wittich94:interaktive,
author = "Wittich, Christian",
title = "Interaktive Extraktion von Satteldächern aus Digitalen Luftbildern",
year = "1994",
city = "Bonn",}
Zöller, Bruno:
Untersuchungen zur phototreuen Animation von Gebäuden
Diplomarbeit, Bonn 1994
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. Wolfgang Schickler [ BibTex ]
@DIPLOMA{zöller94:untersuchungen,
author = "Zöller, Bruno",
title = "Untersuchungen zur phototreuen Animation von Gebäuden",
year = "1994",
city = "Bonn",}
1993
Boeck, Katrin:
Untersuchung zur phototreuen Visualisierung von Gebäuden
Diplomarbeit, Bonn 1993
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. Wolfgang Schickler [ BibTex ]
@DIPLOMA{boeck93:untersuchung,
author = "Boeck, Katrin",
title = "Untersuchung zur phototreuen Visualisierung von Gebäuden",
year = "1993",
city = "Bonn",}
Diemer, Klaus:
Verschmelzung partieller 3D-Modelle von Polyedern
Diplomarbeit, Bonn 1993
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. Carola Braun [ BibTex ]
@DIPLOMA{diemer93:verschmelzung,
author = "Diemer, Klaus",
title = "Verschmelzung partieller 3D-Modelle von Polyedern",
year = "1993",
city = "Bonn",}
Hertel, Antje:
Automatisierung der Objektrekonstruktion aus Bildern
Diplomarbeit, Bonn 1993
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. Gisela Ditze [ BibTex ]
@DIPLOMA{hertel93:automatisierung,
author = "Hertel, Antje",
title = "Automatisierung der Objektrekonstruktion aus Bildern",
year = "1993",
city = "Bonn",}
Klennert, Antje:
Untersuchungen zum Verfahren der anisotropen Diffusion
Diplomarbeit, Bonn 1993
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. Uwe Weidner [ BibTex ]
@DIPLOMA{klennert93:untersuchungen,
author = "Klennert, Antje",
title = "Untersuchungen zum Verfahren der anisotropen Diffusion",
year = "1993",
city = "Bonn",}
Knaff, Henri:
Extraktion morphologisch relevanter Informationen aus Digitalen Höhenmodellen
Diplomarbeit, Bonn 1993
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. Uwe Weidner [ BibTex ]
@DIPLOMA{knaff93:extraktion,
author = "Knaff, Henri",
title = "Extraktion morphologisch relevanter Informationen aus Digitalen Höhenmodellen",
year = "1993",
city = "Bonn",}
Toma, Christian:
Robuste Cluster-Analyse von Digitalbildern
Diplomarbeit, Bonn 1993
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. Thomas Löcherbach [ BibTex ]
@DIPLOMA{toma93:robuste,
author = "Toma, Christian",
title = "Robuste Cluster-Analyse von Digitalbildern",
year = "1993",
city = "Bonn",}
1992
Block, Achim / Otte, Thomas:
Gruppierung von Bildprimitiven in digitalen Bildern
Diplomarbeit, Bonn 1992
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. Claudia Fuchs [ BibTex ]
@DIPLOMA{block*92:gruppierung,
author = "Block, Achim and Otte, Thomas",
title = "Gruppierung von Bildprimitiven in digitalen Bildern",
year = "1992",
city = "Bonn",}
Lincke, Matthias:
Optimierung eines photogrammetrischen Netzes
Diplomarbeit, Bonn 1992
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. W. Riechmann In Zusammenarbeit mit der Volkswagen AG Wolfsburg
[ BibTex ]
@DIPLOMA{lincke92:optimierung,
author = "Lincke, Matthias",
title = "Optimierung eines photogrammetrischen Netzes",
year = "1992",
city = "Bonn",}
Peter, Georg:
Entwicklung eines Algorithmus zum Parsen von Parzellenverbänden
Diplomarbeit, Bonn 1992
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. Claudia Fuchs [ BibTex ]
@DIPLOMA{peter92:entwicklung,
author = "Peter, Georg",
title = "Entwicklung eines Algorithmus zum Parsen von Parzellenverbänden",
year = "1992",
city = "Bonn",}
Treutler, Bernhard:
Verfahren zur Rekonstruktion von Knotenpunktbereichen in Linienbildern
Diplomarbeit, Bonn 1992
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. Carola Braun [ BibTex ]
@DIPLOMA{treutler92:verfahren,
author = "Treutler, Bernhard",
title = "Verfahren zur Rekonstruktion von Knotenpunktbereichen in Linienbildern",
year = "1992",
city = "Bonn",}
1991
Jarczyk, Gregor:
Untersuchungen zur Texturanalyse
Diplomarbeit, Bonn 1991
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. Claudia Fuchs [ BibTex ]
@DIPLOMA{jarczyk91:untersuchungen,
author = "Jarczyk, Gregor",
title = "Untersuchungen zur Texturanalyse",
year = "1991",
city = "Bonn",}
Schindzielorz, Heinz:
Rekonstruktion von Polyedern aus einer perspektiven Skizze
Diplomarbeit, Bonn 1991
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. C. Peters [ BibTex ]
@DIPLOMA{schindzielorz91:rekonstruktion,
author = "Schindzielorz, Heinz",
title = "Rekonstruktion von Polyedern aus einer perspektiven Skizze",
year = "1991",
city = "Bonn",}
1990
Cuda, Albert:
Untersuchung des Konvergenzbereiches des räumlichen Rückwärtsschnittes nach Hinsken
Diplomarbeit, Bonn 1990
Betreuung: Dr.-Ing. Karl-Heiko Ellenbeck, Prof. Dr.-Ing. Wolfgang Förstner [ BibTex ]
@DIPLOMA{cuda90:untersuchung,
author = "Cuda, Albert",
title = "Untersuchung des Konvergenzbereiches des räumlichen Rückwärtsschnittes nach Hinsken",
year = "1990",
city = "Bonn",}
Döring, Volkmar:
Datenstrukturen und Basisalgorithmen für die Verarbeitung von Flächen
Diplomarbeit, Bonn 1990
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. Uwe Tempelmann [ BibTex ]
@DIPLOMA{döring90:datenstrukturen,
author = "Döring, Volkmar",
title = "Datenstrukturen und Basisalgorithmen für die Verarbeitung von Flächen",
year = "1990",
city = "Bonn",}
Glock, Christof:
Erkennung von Symmetrien in Skizzen
Diplomarbeit, Bonn 1990
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. C. Peters [ BibTex ]
@DIPLOMA{glock90:erkennung,
author = "Glock, Christof",
title = "Erkennung von Symmetrien in Skizzen",
year = "1990",
city = "Bonn",}
Hau, Thomas:
Morphologische Glättung von Linien
Diplomarbeit, Bonn 1990
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. C. Peters [ BibTex ]
@DIPLOMA{hau90:morphologische,
author = "Hau, Thomas",
title = "Morphologische Glättung von Linien",
year = "1990",
city = "Bonn",}
Jäger, Hermann J. / Miggelt, Andreas:
Entwicklung und Untersuchung eines Programms zur aktiven Linienmessung in digitalen Bildern
Diplomarbeit, Bonn 1990
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. C. Peters [ BibTex ]
@DIPLOMA{jäger*90:entwicklung,
author = "Jäger, Hermann J. and Miggelt, Andreas",
title = "Entwicklung und Untersuchung eines Programms zur aktiven Linienmessung in digitalen Bildern",
year = "1990",
city = "Bonn",}
Küpper, Martin:
Ermittelung dreidimensionaler Modellkoordinaten von Objekten mit dem Verfahren der Epipolarebenenbild-Analyse
Diplomarbeit, Bonn 1990
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. C. Peters [ BibTex ]
@DIPLOMA{küpper90:ermittelung,
author = "Küpper, Martin",
title = "Ermittelung dreidimensionaler Modellkoordinaten von Objekten mit dem Verfahren der Epipolarebenenbild-Analyse",
year = "1990",
city = "Bonn",}
Reisch, Bernard / Vreden, Tobias:
Automatische Messung des Mittelpunktes von Réseaukreuzen und ellipsenförmigen Targets in digitalen Bildausschnitten
Diplomarbeit, Bonn 1990
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. C. Peters [ BibTex ]
@DIPLOMA{reisch*90:automatische,
author = "Reisch, Bernard and Vreden, Tobias",
title = "Automatische Messung des Mittelpunktes von Réseaukreuzen und ellipsenförmigen Targets in digitalen Bildausschnitten",
year = "1990",
city = "Bonn",}
Weidner, Uwe:
Entwicklung eines Verfahrens zur informationserhaltenen Filterung digitaler Bilder
Diplomarbeit, Bonn 1990
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. C. Peters [ BibTex ]
@DIPLOMA{weidner90:entwicklung,
author = "Weidner, Uwe",
title = "Entwicklung eines Verfahrens zur informationserhaltenen Filterung digitaler Bilder",
year = "1990",
city = "Bonn",}
Willinghöfer, Axel / Wolff, Detlef:
Extraktion einer symbolischen Bildbeschreibung aus digitalen Bildern
Diplomarbeit, Bonn 1990
Betreuung: Prof. Dr.-Ing. Wolfgang Förstner, Dipl.-Ing. C. Peters [ BibTex ]
@DIPLOMA{willinghöfer*90:extraktion,
author = "Willinghöfer, Axel and Wolff, Detlef",
title = "Extraktion einer symbolischen Bildbeschreibung aus digitalen Bildern",
year = "1990",
city = "Bonn",}
This material is presented to ensure timely dissemination of scholarly and technical work. Copyright and all rights therein are retained by authors or by other copyright holders. All persons copying this information are expected to adhere to the terms and constraints invoked by each authors copyright. In most cases, these works may not be reposted without the explicit permission of the copyright holder.







