File: segclass.c

package info (click to toggle)
anthy 6300d-2
  • links: PTS
  • area: main
  • in suites: sarge
  • size: 7,400 kB
  • ctags: 2,270
  • sloc: ansic: 17,009; sh: 13,554; lisp: 1,039; makefile: 252; ruby: 212; perl: 10
file content (127 lines) | stat: -rw-r--r-- 2,966 bytes parent folder | download
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
#include <splitter.h>
#include <wtype.h>
#include <segclass.h>
#include "wordborder.h"

void
anthy_set_seg_class(struct word_list* wl)
{
  int head_pos;
  enum dep_class dc;
  enum seg_class seg_class;

  if (!wl) return;

  head_pos = wl->head_pos;
  dc = wl->part[PART_DEPWORD].dc;
  seg_class = SEG_HEAD;

  if (wl->part[PART_CORE].len == 0) {
    if (dc == DEP_RAW) {
      seg_class = SEG_FUZOKUGO;
    } else if (dc == DEP_END) {
      seg_class = SEG_SHUTAN;
    } else if (dc == DEP_RENYOU) {
      seg_class = SEG_RENYOU;
    } else if (dc == DEP_RENTAI) {
      seg_class = SEG_RENTAI;
    } else if (dc == DEP_KAKUJOSHI) {
      seg_class = SEG_KAKUJOSHI;
    } else {
      seg_class = SEG_FUZOKUGO;
    }
  } else {
    switch (head_pos) {
    case POS_NOUN:
    case POS_NUMBER:
      /* BREAK THROUGH */
    case POS_N2T:
      if (dc == DEP_RAW) {
	seg_class = SEG_MEISHI;
      } else if (dc == DEP_END) {
	seg_class = SEG_MEISHI_SHUTAN;
      } else if (dc == DEP_RENYOU) {
	seg_class = SEG_MEISHI_RENYOU;
      } else if (dc == DEP_KAKUJOSHI) {
	seg_class = SEG_MEISHI_KAKUJOSHI;
      } else {
	seg_class = SEG_MEISHI_FUZOKUGO;
      }
      break;
    case POS_V:
      if (dc == DEP_RAW) {
	seg_class = SEG_DOUSHI;
      } else if (dc == DEP_END) {
	seg_class = SEG_DOUSHI_SHUTAN;
      } else if (dc == DEP_RENYOU) {
	seg_class = SEG_DOUSHI_RENYOU;
      } else if (dc == DEP_RENTAI) {
	seg_class = SEG_DOUSHI_RENTAI;
      } else {
	seg_class = SEG_DOUSHI_FUZOKUGO;
      }
      break;
    case POS_A:
      if (dc == DEP_RAW) {
	seg_class = SEG_KEIYOUSHI;
      } else if (dc == DEP_END) {
	seg_class = SEG_KEIYOUSHI_SHUTAN;
      } else if (dc == DEP_RENYOU) {
	seg_class = SEG_KEIYOUSHI_RENYOU;
      } else if (dc == DEP_RENTAI) {
	seg_class = SEG_KEIYOUSHI_RENTAI;
      } else {
	seg_class = SEG_KEIYOUSHI_FUZOKUGO;
      }
      break;
    case POS_AJV:
      if (dc == DEP_RAW) {
	seg_class = SEG_KEIYOUDOUSHI;
      } else if (dc == DEP_END) {
	seg_class = SEG_KEIYOUDOUSHI_SHUTAN;
      } else if (dc == DEP_RENYOU) {
	seg_class = SEG_KEIYOUDOUSHI_RENYOU;
      } else if (dc == DEP_RENTAI) {
	seg_class = SEG_KEIYOUDOUSHI_RENTAI;
      } else {
	seg_class = SEG_KEIYOUDOUSHI_FUZOKUGO;
      }
      break;
    case POS_AV:
      seg_class = SEG_FUKUSHI;
      break;
    case POS_ME:
      seg_class = SEG_RENTAISHI;
      break;
    case POS_CONJ:
      seg_class = SEG_SETSUZOKUGO;
      break;
    case POS_IJ:
      seg_class = SEG_DOKURITSUGO;
      break;
    case POS_OPEN:
      seg_class = SEG_HIRAKIKAKKO;
      break;
    case POS_CLOSE:
      seg_class = SEG_TOJIKAKKO;
      break;
    default:
      seg_class = SEG_DOKURITSUGO;
      break;
    }
  }
  wl->seg_class = seg_class;
}

int anthy_seg_class_is_depword(enum seg_class sc)
{
  if (sc == SEG_FUZOKUGO ||
      sc == SEG_KAKUJOSHI ||
      sc == SEG_RENYOU ||
      sc == SEG_RENTAI ||
      sc == SEG_SHUTAN) {
    return 1;
  } else {
    return 0;
  }
}