絕對!
事實上,只要它與你自己的工作相關,我就會強烈鼓勵它。隨著時間的推移,我們學術界的許多人忘記了科學研究應該是可重復的。代碼應保持最新,并記錄以供其他人使用。 只要采取合理的預防措施來解決任何隱私問題,就應該共享數據集。
我認為共享數據集對社區來說是一件好事。一般來說,這也有利于研究人員本身,因為每當使用他們的數據集發表新工作時,他們可能會得到對自己工作的引用。 不幸的是,有時公司要求我們不要發布一些測量/爬網數據,這可能會阻礙事情的發展。但無論如何,您應該始終詢問某個數據集或代碼段是否可用。