网上普遍使用的化学方程式的格式普遍如下
例: KMnO4+FeSO4+H2SO4=Fe2(SO4)3+MnSO4+K2SO4+H2O
要把化学方程式格式化,单单一个正则表达式是非常反人类的,故可选用 C++ 实现化学方程式的格式化。
首先,写一个 for 循环,传入字符数组 input[] ,依次地判断当前字符的位置
然后,声明一个宽字符串: wstring output[]
算法根据循环里的 if 语句判断当前字符是否符合条件,然后把这个字符输出到 output[] 中
for(int i=1;i
因为传入的字符数组是没有经过格式化的,所以第一个字符一定不用处理,故循环从1开始。
循环开始时,先判断当前的字符是不是空格,如果是空格,就直接无视,跳到下一次的循环。
因为直接跳到了下一次的循环中,所以 input[i] 的字符没有加入到 output 中,也就是自动地把空格给除去了。
然后,在判断当前的字符是否为 +、=、(、) 中的一种,因为这个字符的前后是不可能存在数字下标的,直接加入到输出的 output[] 数组中。
同样的,遇到前一个字符是 +、=、( 也同样直接加入到输出数组中。
实现代码:
for (int i = 1;i < strlen(input);++i){ if(input[i] == ' ') continue; if (input[i - 1] == '+' || input[i - 1] == '=' || input[i - 1] == '(' || input[i] == '+' || input[i] == '=' || input[i] == '(' || input[i] == ')') { output += input[i]; continue;}
继续我们的判断,如果当前字符是 A-Z 、 a-z 的,直接加入输出字符数组中。
如果当前字符是数字的,直接将它变成下标。
为了防止 C60 这种由超过 9 个原子组成的分子参与化学反应的情况,所以还要加入一句判断语句来判断。
实现代码:
for (int i = 1;i < strlen(input);++i){ if(input[i] == ' ') continue; if (input[i - 1] == '+' || input[i - 1] == '=' || input[i - 1] == '(' || input[i] == '+' || input[i] == '=' || input[i] == '(' || input[i] == ')') { output += input[i]; continue; } if (input[i] >= 'A' && input[i] <= 'Z') { output += input[i]; continue; } if (input[i] >= 'a' && input[i] <= 'z') { output += input[i]; continue; } if (input[i - 1] >= '0' && input[i - 1] <= '9') { output += input[i]; continue; } if (input[i] >= '0' && input[i] <='9') { outputBigNumToSmall((int)(input[i]-'0')); }}
因为 C++ 标准库并没有把数字转成下标的函数,所以我们要实现一个将数字转成下标的函数
实现代码:
void outputBigNumToSmall(int num){ switch (num) { case 0: output.append(L"₀"); break; case 1: output.append(L"₁"); break; case 2: output.append(L"₂"); break; case 3: output.append(L"₃"); break; case 4: output.append(L"₄"); break; case 5: output.append(L"₅"); break; case 6: output.append(L"₆"); break; case 7: output.append(L"₇"); break; case 8: output.append(L"₈"); break; case 9: output.append(L"₉"); break; default: output.append(L"(unknown)"); break;}
至此,只要输出 output[] 就可以了。