Abstract:
Запропоновано метод обчислення семантичної близькості для слів природної мови. Семантична близькість дає змогу побудувати алгоритмічні моделі різних лінгвістичних задач таких, як: розв’язання смислових неоднозначностей, ідентифікація об’єктів тексту, семантичний аналіз текстів тощо. Описаний алгоритм є зваженою модифікацією методу лексичного перетину.
Description:
The paper concerns methods of calculating semantic relatedness and similarity measures for evaluating closeness of words meanings in tasks of computational linguistics. The semantic relatedness and similarity measures allows to implement algorithmic models of linguistic context analysis to solve such problems as words meaning ambiguity, entity recognition, semantic analysis of natural language texts etc. The work describes one method for calculating measure of semantic closeness of natural language words meanings. This method is a weighted modification of overlap based metrics, as a data source we use Wikipedia. For estimation of weighting parameters we use a simulate annealing.