I have also tried to test a similar project. The bigger the data source, the more correct, in my case is 96.52%.
If you are interested, then I will write a php script for you, you have full permission to change the source data.
Demo:
Input: chuong trinh tu dong ho tro tieng viet
10 the closest:
{chương trình tự động hỗ trợ tiếng việt=76.19115506720237, chương trình từ đồng hỗ trợ tiếng việt=80.39043241070169, chương trình từ động hỗ trợ tiếng việt=80.53984043487227, chương trình tự động hỗ trợ tiếng viết=81.91570798921579, chương trình tự đồng hỗ trợ tiếng việt=82.4075724594827, chương trình tư đồng hỗ trợ tiếng việt=82.44277747211025, chương trình tự động hỗ trợ tiếng viêt=84.11293256655202, chương trình tu đồng hỗ trợ tiếng việt=84.27226559793141, chương trình tu động hỗ trợ tiếng việt=84.36046905478418, chương trình từ đông hỗ trợ tiếng việt=84.69315287455161}
Sorry for my bad english