Code-Duplizierung ist eine der lästigsten Hürden bei der Software-Wartung. Die Erkennung von Klonen muss als proaktive Maßnahme in der Softwareentwicklung eingesetzt werden, um die Probleme, die durch Klone entstehen, später in den Phasen wie Test und Wartung zu vermeiden.Das Hauptaugenmerk dieser Arbeit liegt auf der Erkennung von Duplikaten im Quellcode, die einer der Hauptgründe für schlechte Struktur in realen Programmen sind. Der neuartige Ansatz unseres Klonerkennungsansatzes ist die Erkennung von Near-Miss-Klonen auf Dateiebene als Hilfsmittel für die Softwarewartung. Near-Miss-Klone sind diejenigen, die sich nicht genau gleichen und sich möglicherweise Änderungen in Variablennamen, Literalen, Leerzeichen usw. erlauben, aber was die Funktionalität betrifft, eine ähnliche Ausgabe liefern. Unsere Arbeit basiert auf Metriken und Abstract Syntax Tree-basierten Ansätzen und berücksichtigt die Levenshtein-Distanz. Für experimentelle Ergebnisse haben wir ein Tool entwickelt, das auf der vorgeschlagenen Methode basiert, und die erzielten Ergebnisse zeigen deutlich, dass es effektiv die Beinahe-Klone auf Dateiebene, d. h. zwischen verschiedenen Dateien, erkennt.