Volltext-Downloads (blau) und Frontdoor-Views (grau)

Konzeptionierung und Implementierungen zur automatischen Extraktion von Maßstab und Geometrie aus Fotos von Bauplänen

  • Diese Arbeit befasst sich mit der Redigitalisierung von ausgedruckten Architektur-zeichnungen mit möglichst einfachen Mitteln. So sollen Fotos von herkömmlichen Smartphones die Grundlage für die Extraktion von Maßstab und Raumgeometrien sein. Der erste der drei Schritte, die das Foto dabei durchläuft, ist die Beseitigung von perspektivischen Verzerrungen (Rektifizierung). Die hierfür benötigtenDiese Arbeit befasst sich mit der Redigitalisierung von ausgedruckten Architektur-zeichnungen mit möglichst einfachen Mitteln. So sollen Fotos von herkömmlichen Smartphones die Grundlage für die Extraktion von Maßstab und Raumgeometrien sein. Der erste der drei Schritte, die das Foto dabei durchläuft, ist die Beseitigung von perspektivischen Verzerrungen (Rektifizierung). Die hierfür benötigten Punkte werden durch ein, in dieser Arbeit trainiertes, Convolutional Neural Network (CNN) detektiert. Die so ermittelten Positionen stellen im zweiten Schritt, der Ermittlung eines Maßstabes, die Grundlage für das Auslesen der Maßzahlen mittels optical character recognition (OCR) dar. Da Räume nicht als solche in Bauzeichnungen eingezeichnet sind, werden im letzten Schritt, zuerst Wände, Türen und Fenster, durch mehrere mathematische Faltungen (convolutions) lokalisiert und innerhalb dieser Elemente, mittels wachsender Regionen, nach Räumen und Fluren gesucht. Nach dem ein Foto diese Schritte durchlaufen hat, werden die ermittelten Geometrien sowie der Maßstab in einer Liste abgespeichert und im rektifizierten Bild, zusammen mit den berechneten Flächeninhalten, visualisiert. So kann ein Anwender schnell und einfach den Erfolg des Programmoutputs beurteilen. Eine Versuchsreihe mit einigen Fotos ergab, dass ein Schattenwurf auf dem Papierplan bei Aufnahme des Lichtbildes zu vermeiden ist, da dieser sowohl bei der Auswertung durch das CNN, als auch innerhalb des OCR-Vorgangs zu Problemen führt, die in einigen Fällen eine Rektifizierung oder Maßstabsermittlung verhinderten. Bei den übrigen fünf Fotos wurden durchschnittlich 31,8 von 32 Räumen detektiert, dabei wurde zwischen zwei und zwölf mal fälschlicherweise die Fensterbank als Fußboden detektiert. Die Standardabweichung der Flächeninhalte aller Räume betrug dabei 0,66 m², werden nur die Räume betrachtet, bei denen die Fensterbank korrekt erkannt wurde, beträgt die Standardabweichung lediglich 0,25 m². Insgesamt werden die in dieser Arbeit erzielten Ergebnisse als „gut“ eingestuft, es bleiben jedoch auch einige Optimierungsmöglichkeiten an verschiedenen Stellen, besonders bei der Suche nach Räumen, bestehen.show moreshow less
  • This work is about the redigitalization of printed architectural drawings with the simplest possible equipment. Photos, taken with conventional smartphones should be the basis for extracting a scale and spatial geometries. The first of the three steps the photo goes through is the removal of perspective distortions (rectification). The points that are needed for this step are detected by aThis work is about the redigitalization of printed architectural drawings with the simplest possible equipment. Photos, taken with conventional smartphones should be the basis for extracting a scale and spatial geometries. The first of the three steps the photo goes through is the removal of perspective distortions (rectification). The points that are needed for this step are detected by a convolutional neuronal network (CNN) that is also constructed and trained in this work. These positions are used in the second step for the optical character recognition (OCR) to read out the dimensions of the building. Whith the differenz between these positions and the belonging dimensions it is possible to determine a scale for the rectifiered picture. Because rooms ane not drawn as such in architectural drawings, the third step consists of two parts. First the walls, doors and windows ale localized by the use of several convolutions, then growing regions where used to find the rooms inbetween these elements. After a Foto passed these steps, the determined geometries and the scale is stored in al list and visualized in the rectified picture, together with the calulated area contents. This allows a user to quickly and easily evaluate the success of the program output. A series of tests with some photos showed, that a shadow cast on the paper plan should be avoided, because the differenzen in the illumination leads to problems by the use of the CNN and by the optical character recognition. These problems prevent that the image became rectified. In the remaining five photos, an average of 31.8 of 32 rooms were detected, however the window sill was detected incorrectly as floor between two and twelve times. The standard deviation of the area of all rooms was 0.66 m². If only the rooms where the window sill was correctly detected are considered, the standard deviation is only 0.25 m². Overall, the results achieved in this work are classified as "good", but there also remains some potential for optimization in various places, especially in the search for rooms.show moreshow less

Download full text files

  • Masterthesis_Adrian_Acker_Redigitalisierung.pdf
    deu

Export metadata

Statistics

frontdoor_oas
Metadaten
Author:Adrian Acker
Place of publication:Offenburg
Year of Publication:2022
Page Number:V, 76
GND Keyword:Bildverarbeitung; Convolutional Neural Network; Maßstab
Tag:Rektifizierung
DDC classes:000 Allgemeines, Informatik, Informationswissenschaft
Advisor:Klaus Dorer, Benedikt Rombach
Publishing Institution:Hochschule Offenburg
Granting Institution:Hochschule Offenburg
Date of final exam:2022/04/19
Document Type:Master's Thesis
Language:German
Release Date:2022/05/16
Institutes:Abschlussarbeiten / Master-Studiengänge / MMR
Open Access: Closed Access 
Licence (German):License LogoCreative Commons - CC BY - Namensnennung 4.0 International