HashSet пересекается с количеством слов, но только уникальных

StackOverflow https://stackoverflow.com/questions/980073

  •  13-09-2019
  •  | 
  •  

Вопрос

я получил элемент управления RichTextBox в форме и текстовый файл.Я получаю текстовый файл в массив и получаю richtextbox1.text в другой массив, чем сравниваю его и подсчитываю совпадение слов.Но, например, в текстовом файле есть два слова "name" и три слова "and" в richtextbox ..Таким образом, если в текстовом файле в richtextbox есть два одинаковых слова, это не может быть 3 или выше после 2, это должно быть неправильное слово, поэтому оно не должно учитываться.Но HashSet подсчитывает только уникальные значения, не ища дубликаты в текстовом файле.Я хочу сравнить каждое слово в текстовом файле со словами в RichTextBox ..(извините за мой английский.)

Мои коды здесь ;

        StreamReader sr = new StreamReader("c:\\test.txt",Encoding.Default);
        string[] word = sr.ReadLine().ToLower().Split(' ');
        sr.Close();
        string[] word2 = richTextBox1.Text.ToLower().Split(' ');
        var set1 = new HashSet<string>(word);
        var set2 = new HashSet<string>(word2);
        set1.IntersectWith(set2);

        MessageBox.Show(set1.Count.ToString());
Это было полезно?

Решение

Делая вывод, что вы хотите:

файл:

foo
foo
foo
bar

текстовое поле:

foo
foo
bar
bar

в результате получается '3' (2 foo и одна полоса)

Dictionary<string,int> fileCounts = new Dictionary<string, int>();
using (var sr = new StreamReader("c:\\test.txt",Encoding.Default))
{
    foreach (var word in sr.ReadLine().ToLower().Split(' '))
    {
        int c = 0;
        if (fileCounts.TryGetValue(word, out c))
        {
            fileCounts[word] = c + 1;
        }
        else
        {
            fileCounts.Add(word, 1);
        }                   
    }
}
int total = 0;
foreach (var word in richTextBox1.Text.ToLower().Split(' '))
{
    int c = 0;
    if (fileCounts.TryGetValue(word, out c))
    {
        total++;
        if (c - 1 > 0)
           fileCounts[word] = c - 1;                
        else
            fileCounts.Remove(word);
    }
}
MessageBox.Show(total.ToString());

Обратите внимание, что это деструктивно изменяет прочитанный словарь, вы можете избежать этого (поэтому вам нужно прочитать словарь только один раз), просто посчитав поле расширенного текста таким же образом, а затем взяв минимальное количество отдельных отсчетов и суммировав их.

Другие советы

Вам нужно, чтобы показатели были одинаковыми?Тогда тебе нужно сосчитать слова...

    static Dictionary<string, int> CountWords(string[] words) {
        // use (StringComparer.{your choice}) for case-insensitive
        var result = new Dictionary<string, int>();
        foreach (string word in words) {
            int count;
            if (result.TryGetValue(word, out count)) {
                result[word] = count + 1;
            } else {
                result.Add(word, 1);
            }
        }
        return result;
    }
        ...
        var set1 = CountWords(word);
        var set2 = CountWords(word2);

        var matches = from val in set1
                      where set2.ContainsKey(val.Key)
                         && set2[val.Key] == val.Value
                      select val.Key;
        foreach (string match in matches)
        {
            Console.WriteLine(match);
        }
Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top