還沒有全自動,所以自己生。
我們不知道怎麼放下來。
我們覺得這個比較自然。
對,她手刻的。
對,這個有一點陽春。
對,我就用那個API,會自動生成圖片,然後再一起去。
對,因為要滿足一定的字數才可以po文,所以我們轉不出那麼多字,所以只好用這個。
但是轉出來當標題。
沒有季節。所以是這一句話的這個標題。
我們新聞句也有拿進來用,但是當作新聞用。
不是。
下面有回覆,十幾分鐘後也有剛剛那一篇。
這個也是自動放上去的。
我們那時候有把市長的名字切掉。
我們有template,因為我沒有辦法生成那麼長的句子,我們是一句句,我們只能一句map到另外一句。
這個是轉出來的,我們轉出來是當title。
就是其中一篇。
這一類的文章特別多。
那時候剛好選舉前。
我第一次PO的時候超緊張,超怕被水桶。
因為需要一定的限制。
已經有了。
有。可以找那一篇,但是現在找不到。
還沒有。
其實仔細看會有一點卡,但是假如事先不知道的話,我覺得是可以處理。
對。
一個個字。
因為通常都是對某個地區去進行空氣品質的描述,我們也希望描述儘量相似,就是形容的方法不一樣,因為本來句子不少,要上百萬句做英文的比較快,也就是講話風格轉換,所以這個比較小的domain上的話,會希望他們儘量match在一起,做得比較起來。
你是說有關地區嗎?
Rule based。
不是,但是也是講某個區域的空氣品質不好,我們可以做替換,替換我們要去。
一開始去看標題,反正太少了,就全文,然後找了有用的句子當作我們的資料庫。
對,不管是正向或者是反向,都會有他的效果。
對。如果形容是好的,我們會抓下來,我們會看是不是只有抓抱怨的,但是很多是講反話,所以我們都拿下來放到我們的資料庫裡面。
很難說特別強烈,他們都有一套形容的方法。
他們講的方法。
對,就是一定要跟地區。
地區的目的是為了跟測站的資訊連結。
就直接爬下來,然後一個個切。我們要風格轉換,所以我們也有一定的限制,我們希望兩個資訊,一個是空氣品質的資訊,第二個是地區的資訊,因為我們要跟測站作連結,測站在哪一個地區,轉出來的文字就要包含那個地區跟那個地區的空氣品質資訊,所以我們在做的時候,一定要看包含某個縣市的名字、測站的名字,怎麼描述都要說。
對,有出現這個情況,也就是有可能會斷,因為我們是手動切的,就自己看。應該是可以寫成一個rule base。
就是有一些市長的名字特別容易出現,就是把整句過濾掉。
我們還有做一件事,也就是政治類的刪掉,也就是寫政治人物,有關於政治的……
新聞稿的話,就是從文章、內容去切句子,但是鄉民會從下面的推文。因為剛剛有說資料的元素會,我們會找到資料文章,有關於空氣品質並沒有想那麼多,因此想說回覆一起加進去,然後包括一些比較直白或者是比較酸的話。
其實主要是希望鄉民的資料庫多一點。
比較典型的題目。