Show simple item record

dc.contributor.advisorΚαβαλλιεράτου, Εργίναel_GR
dc.contributor.authorΕυαγόρου, Ανδρέας - Χρίστοςel_GR
dc.contributor.authorΠολυχρόνης, Μάριος - Γεώργιοςel_GR
dc.coverage.spatialΣάμοςel_GR
dc.date.accessioned2015-11-17T10:32:28Z
dc.date.available2015-11-17T10:32:28Z
dc.date.issued2011el_GR
dc.identifier.otherhttp://catalog.lib.aegean.gr/webopac/List.csp?SearchT1=Word+spotting+%CE%BA%CE%B1%CE%B9+clustering+%CE%B5%CE%B9%CE%BA%CF%8C%CE%BD%CF%89%CE%BD+%CF%87%CE%B5%CE%B9%CF%81%CF%8C%CE%B3%CF%81%CE%B1%CF%86%CF%89%CE%BD+%CE%BB%CE%AD%CE%BE%CE%B5%CF%89%CE%BD&Index1=Keywordsbib&Database=1&NumberToRetrieve=50&OpacLanguage=gre&SearchMethod=Find_1&SearchTerm1=Word+spotting+%CE%BA%CE%B1%CE%B9+clustering+%CE%B5%CE%B9%CE%BA%CF%8C%CE%BD%CF%89%CE%BD+%CF%87%CE%B5%CE%B9%CF%81%CF%8C%CE%B3%CF%81%CE%B1%CF%86%CF%89%CE%BD+%CE%BB%CE%AD%CE%BE%CE%B5%CF%89%CE%BD&Profile=Default&PreviousList=Start&PageType=Start&EncodedRequest=*A4*1C2*C9*3A*D6*A5*07*03*0Dl*0A*CBr*C01&WebPageNr=1&WebAction=NewSearch&StartValue=1&RowRepeat=0&MyChannelCount=
dc.identifier.urihttp://hdl.handle.net/11610/8801
dc.description.abstractΗ συγκεκριμένη διπλωματική εργασία, ασχολείται με την τεχνική του Word Spotting καθώς και την ομαδοποίηση (Clustering) εικόνων χειρόγραφων λέξεων. Σκοπός της εργασίας ήταν η τροποποίηση και βελτίωση κάποιων ήδη υπάρχον μεθόδων, για την ομαδοποίηση χειρόγραφων λέξεων, γραμμένες από πλήθος διαφορετικών ατόμων. Χρησιμοποιήθηκαν συνολικά πέντε μέθοδοι, εκ των οποίων οι δύο πάρθηκαν από τη βιβλιογραφία ως πρότυπο και με βάση αυτές, δημιουργήθηκαν και υλοποιήθηκαν τρεις νέες μέθοδοι με σκοπό να φέρουν καλύτερα αποτελέσματα από τις δύο ήδη υπάρχουσες. Για το σκοπό της σύγκρισης των δύο υπάρχον και των τριών νέων μεθόδων, δημιουργήθηκαν τρία διαφορετικά σύνολα δεδομένων, τα οποία αξιολογήθηκαν με βάση τέσσερα μέτρα αξιολόγησης (Precision, Recall, F-measure, Purity). Αξίζει να σημειωθεί, ότι μέσα από τη σύγκριση των εν λόγω μεθόδων, προέκυψαν καλύτερα αποτελέσματα ομαδοποίησης στις τρεις νέες μεθόδους που δημιουργήθηκαν από τις δύο ήδη υπάρχουσες, επιτυγχάνοντας έτσι το σκοπό της εργασίας. Συγκεκριμένα στο κεφάλαιο 1 δίνεται μία μικρή εισαγωγή της εργασίας αυτής. Στο κεφάλαιο 2, παρουσιάζονται κάποια γενικά στοιχεία του Word Spotting, αρχίζοντας με τον ορισμό της τεχνικής του, και συνεχίζοντας με τα προβλήματα τα οποία καλείται να αντιμετωπίσει, την βασική του ιδέα, τα στάδια από τα οποία αποτελείται, καθώς και κάποιες εργασίες που έχουν γίνει γύρω από το θέμα αυτό. Επίσης, γίνεται μια μικρή αναφορά σχετικά με την αποτυχία του Optical Character Recognition (OCR), στις περιπτώσεις χειρόγραφων εγγράφων. Στο κεφάλαιο 3, παρουσιάζονται βασικά στάδια υλοποίησης, που περιλαμβάνονται μέσα στο Word Spotting, τα οποία είναι απαραίτητα τόσο για την επιτυχία του Word Spotting, όσο για τη σωστή ομαδοποίηση των χειρόγραφων εικόνων, καθώς επίσης δίνεται και μια περιγραφή δύο ειδών μετασχηματισμού, οι οποίοι είναι απαραίτητοι για την υλοποίηση των μεθόδων της εργασίας. Στο κεφάλαιο 4, αρχικά δίνεται μια μικρή εισαγωγή του κεφαλαίου, την οποία ακολουθεί μια σύντομη περιγραφή των 5 μεθόδων που υλοποιήθηκαν για τους σκοπούς της εργασίας. Στη συνέχεια, παρουσιάζονται τα σύνολα δεδομένων που χρησιμοποιούνται στα πειράματα της εργασίας, καθώς και η μέθοδος αξιολόγησης των πειραμάτων αυτών. Τέλος, δίνεται αναλυτική περιγραφή της υλοποίησης των πέντε σεναρίων, δηλαδή, των δύο ήδη υπάρχον και των τριών νέων προτεινόμενων, τα οποία έχουν στόχο την ομαδοποίηση εικόνων χειρόγραφων λέξεων διάφορων συγγραφέων. Στο κεφάλαιο 5, παρουσιάζονται τα συγκριτικά αποτελέσματα που έδωσαν οι 5 μέθοδοι, και δίνονται τα συμπεράσματα που εξάχθηκαν από τα αποτελέσματα αυτά.el_GR
dc.description.abstractIn this dissertation, some stages of the Word Spotting technique are applied, and more particularly, the stages that are needed, so that the Clustering of handwritten word images can be performed successfully. The main goal of this project was to produce the implementations of 2 methods that have been already proposed in an older paper, and based on those implementations, apply some modifications, so that some new, better performed, methods can be created. A significant difference between the initial methods and the ones proposed here, is that the initial methods were created with the target of applying the Word Spotting technique on handwritten document images of one (or a small group of) writer(s), while, on the other hand, the proposed methods of this dissertation, were created with the target of applying the Clustering process of handwritten word images of many writers. Although not all the stages of the Word Spotting technique were applied in the presented methods, it is our belief that the hard work has been done, and that adding the rest of the stages is not of huge importance. More specifically, the first of the initial methods made use of the Dynamic Time Warping (DTW) algorithm in the Matching stage, while the second one made use of the Discrete Fourier Transform (DFT), to transform the extracted features of the word images. While our implementation of those two methods might not be an exact match of the implementations of the original paper, we believe that it came very close to the originals, as we followed almost all the stages presented in that paper. The method that we implemented and was purporting the original first method was method 1 of this project, while the method that we implemented and was purporting the original second method was method 3. One of the new methods created in this project (method 2), was a modification of method 1, where the modifications that were implemented were mostly in the pre-processing stage, the feature extraction stage and the Clustering stage. In more detail, the pre-processing was chosen so that it would work best for our data sets, some new features were added in the list of extracted features from each word image, and a different Clustering algorithm was used, with a different distance metric. Another one of the new methods created during this dissertation (method 4), was a modification of method 3, where the modifications that were implemented were mostly in the pre-processing stage, and the feature extraction stage. In more detail, the pre-processing again was chosen so that it would work best for our data sets, and some new features were added in the list of extracted features from each word image. The last one of the methods proposed (method 5), is an alternate approach of method 4, where instead of the DFT, the Discrete Cosine Transform (DCT) was used to transform the features extracted from each image. Three data sets were used in our experiments, where two of them were of good quality (one of few images (200), and one of many images (1008)), and one of them (this set was also consisted of 200 images), contained randomly taken images from a larger set that contained both good and bad quality’s word images. For the evaluation of the performance of the Clustering process, four performance indicators were used: precision, recall, F-measure, and purity. For a small description of the dissertation, in chapter 1, a small introduction is given, while in chapter 2, a general approach of the Word Spotting technique is given. Specifically, in chapter 2 a definition of the technique, and some of the problems that it has to face are provided, the reason why Optical Character Recognition (OCR) fails in the case of handwritten documents is given, the basic idea of Word Spotting is presented, followed by a description of its stages. Finally, the chapter ends with a brief discussion of some related work that has been done on this field. In chapter 3, the basic stages of the Word Spotting technique which are implemented in this dissertation are presented, while a small description of the two transformations that are used in some of the implemented methods is also provided. Proceeding to chapter 4, a small introduction of the chapter is found, followed by a brief description of the methods implemented in this dissertation. Then, a presentation of the data sets is given, and the evaluation method of our experiments is explained, an extensive description of the implementations of the methods is also given, and finally, we present a Graphical User Interface (GUI), which was created so that the use of our methods can be performed with ease. Chapter 5 contains the final results of all 5 methods, and the conclusions extracted from those results. By viewing the final results, it is our opinion that we have accomplished our goal, by managing to modify the original methods and got them to give better results, and by making them able to be applied successfully in handwritten word images written by many different writers.el_GR
dc.language.isoelel_GR
dc.subjectΣυσταδοποίηση εικόνωνel_GR
dc.subjectΑναγνώριση προτύπωνel_GR
dc.subjectΧειρόγραφα έγγραφαel_GR
dc.subjectWord spottingel_GR
dc.subjectClusteringel_GR
dc.subjectPattern recognitionel_GR
dc.subjectHandwritten word imagesel_GR
dc.subject.lcshPattern recognition systems
dc.titleWord spotting και clustering εικόνων χειρόγραφων λέξεωνel_GR
dcterms.accessRightsfreeel_GR
dcterms.rightsΔιάθεση πλήρους κειμένου - Ελεύθερη πρόσβαση. Κλειδωμένη η δυνατότητα αντιγραφής (copy) του κειμένου.
heal.typebachelorThesisel_GR
heal.academicPublisherΠανεπιστήμιο Αιγαίου. Σχολή Θετικών Επιστημών. Τμήμα Μηχανικών Πληροφοριακών και Επικοινωνιακών Συστημάτων.el_GR
heal.academicPublisherIDaegeanel_GR
heal.fullTextAvailabilitytrueel_GR


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record